AI资讯新闻榜单内容搜索-训练数据

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

vivo自研大模型用的数据筛选方法，公开了。

来自主题: AI技术研报

11547 点击 2025-05-15 14:11

字节Seed首次开源代码模型！Seed-Coder，8B规模，超越Qwen3，拿下多个SOTA。它证明“只需极少人工参与，LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据，可大幅提升模型代码生成能力。

来自主题: AI资讯

10146 点击 2025-05-11 15:18

字节开源图像编辑新方法，比当前SOTA方法提高9.19%的性能，只用了1/30的训练数据和1/13参数规模的模型。

来自主题: AI技术研报

9142 点击 2025-05-08 09:52

具身智能的突破离不开高质量数据。目前，具身合成数据有两条主要技术路线之争：“视频合成+3D重建”or “端到端3D生成”。英伟达在CES 2025指出“尚无互联网规模的机器人数据”，自动驾驶已具备城市级仿真，但家庭等复杂室内环境缺乏3D合成平台。

来自主题: AI技术研报

9843 点击 2025-04-20 21:42

北京大学团队继VARGPT实现视觉理解与生成任务统一之后，再度推出了VARGPT-v1.1版本。该版本进一步提升了视觉自回归模型的能力，不仅在在视觉理解方面有所加强，还在图像生成和编辑任务中达到新的性能高度

来自主题: AI技术研报

8663 点击 2025-04-16 09:44

在大模型迈向推理时代的当下，数学推理能力已成为衡量语言模型智能上限的关键指标。

来自主题: AI技术研报

5902 点击 2025-04-14 09:01

千亿参数内最强推理大模型，刚刚易主了。32B——DeepSeek-R1的1/20参数量；免费商用；且全面开源——模型权重、训练数据集和完整训练代码，都开源了。这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——

来自主题: AI资讯

11924 点击 2025-04-13 23:34

让大语言模型更懂特定领域知识，有新招了！

来自主题: AI技术研报

10648 点击 2025-04-07 15:26

在人工智能飞速发展的今天，LLM 的能力令人叹为观止，但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」，无法直接触及实时信息或外部工具。

来自主题: AI技术研报

9428 点击 2025-04-06 15:58

当我们遇到新问题时，往往会通过类比过去的经验来寻找解决方案，大语言模型能否如同人类一样类比？在对大模型的众多批判中，人们常说大模型只是记住了训练数据集中的模式，并没有进行真正的推理。

来自主题: AI技术研报

11039 点击 2025-04-03 10:50