AI资讯新闻榜单内容搜索-训练

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

6324 点击 2024-10-14 10:12

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

计算资源并非性能提升的唯一途径：Arvind Narayanan 认为，仅仅增加计算资源并不总是能带来模型性能的等比提升。目前，数据量正逐渐成为限制AI发展的主要瓶颈。

来自主题: AI资讯

6024 点击 2024-10-14 09:17

苹果发文质疑：大语言模型根本无法进行逻辑推理

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

4594 点击 2024-10-14 09:16

红杉年度文章解读：生成式AI进入第二阶段，应用层价值凸显以及商业模式将重塑

在红杉资本在最新发布的文章《Generative AI's Act O1 ：The Agentic Reasoning Era Begins》中，讨论了当下生成式AI正在从以训练时计算的快思考，向以推理时计算的慢思考发展。OpenAI 的新模型 o1便是重要的标志。慢思考的到来也将会带来新的机会，行业认知的重要性被高度重视起来，过去对于AI应用以及背后的商业理解也将被刷新。

来自主题: AI资讯

8961 点击 2024-10-12 15:03

奥特曼准备用o1来训练AI了？OpenAI最新论文验证该方法可行性！

谁更懂AI训练，是人类还是AI自己？

来自主题: AI资讯

9658 点击 2024-10-12 14:57

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

在当今的人工智能领域，Transformer 模型已成为解决诸多自然语言处理任务的核心。然而，Transformer 模型在处理长文本时常常遇到性能瓶颈。传统的位置编码方法，如绝对位置编码（APE）和相对位置编码（RPE），虽然在许多任务中表现良好，但其固定性限制了其在处理超长文本时的适应性和灵活性。

来自主题: AI技术研报

8436 点击 2024-10-12 14:29