AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?

来自主题: AI技术研报
9295 点击    2024-06-24 15:25
还不到6个月,GPTs黄了

还不到6个月,GPTs黄了

还不到6个月,GPTs黄了

上周,不少人发现微软官网忽然更新了一条“GPT Builder 即将停用”的通知。宣布将从7月10日起终止对Copilot GPT的支持,并会在四天内把平台上所有已创建的GPT连同相关数据全部删除。

来自主题: AI资讯
8509 点击    2024-06-24 11:13
用魔法打败魔法:用AI控制AI算力碳排放

用魔法打败魔法:用AI控制AI算力碳排放

用魔法打败魔法:用AI控制AI算力碳排放

AI的终点是电力。因为数据中心最终要实现可持续发展,净零碳排放,AI的真正的终点是清洁电力。

来自主题: AI资讯
7355 点击    2024-06-24 11:08
有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

有钱买卡还不够,10万卡H100集群有多难搭?一文解析算力集群技术要点

在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。

来自主题: AI资讯
8062 点击    2024-06-23 19:25
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。

来自主题: AI技术研报
7240 点击    2024-06-21 14:05
ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。

来自主题: AI资讯
7860 点击    2024-06-21 13:34
鹅厂大模型人才扩招50%!面向全球顶尖天才少年:薪资算力数据管够

鹅厂大模型人才扩招50%!面向全球顶尖天才少年:薪资算力数据管够

鹅厂大模型人才扩招50%!面向全球顶尖天才少年:薪资算力数据管够

毕业季,大模型人才正在被各家大厂和创业公司重金哄抢。 刚刚,腾讯也曝光了他们与大模型相关的人才计划,并且直通2025年校招—— 将面向全球范围内大举扩招50%大模型人才,并且放话薪资算力什么的不用愁。 不出所料,各家抢人下手都既快又狠,晚一步生怕就抢不到(不是)。

来自主题: AI资讯
9617 点击    2024-06-20 23:07