AI资讯新闻榜单内容搜索-模型训练

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？ 7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。

来自主题: AI技术研报

4718 点击 2024-10-14 10:12

深度｜普林斯顿教授Arvind：构建大参数模型不再有效，数据正成为瓶颈；社会对AI过度恐惧

计算资源并非性能提升的唯一途径：Arvind Narayanan 认为，仅仅增加计算资源并不总是能带来模型性能的等比提升。目前，数据量正逐渐成为限制AI发展的主要瓶颈。

来自主题: AI资讯

4992 点击 2024-10-14 09:17

苹果发文质疑：大语言模型根本无法进行逻辑推理

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

3880 点击 2024-10-14 09:16

奥特曼准备用o1来训练AI了？OpenAI最新论文验证该方法可行性！

谁更懂AI训练，是人类还是AI自己？

来自主题: AI资讯

7845 点击 2024-10-12 14:57

NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能

在当今的人工智能领域，Transformer 模型已成为解决诸多自然语言处理任务的核心。然而，Transformer 模型在处理长文本时常常遇到性能瓶颈。传统的位置编码方法，如绝对位置编码（APE）和相对位置编码（RPE），虽然在许多任务中表现良好，但其固定性限制了其在处理超长文本时的适应性和灵活性。

来自主题: AI技术研报

6678 点击 2024-10-12 14:29

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

近日，来自谷歌DeepMind的研究人员提出了Michelangelo，「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。

来自主题: AI技术研报

4097 点击 2024-10-12 11:07

一文看懂LLM推理，UCL汪军教授解读OpenAI ο1的相关方法

OpenAI 最近发布的 o1 系列模型堪称迈向强人工智能的一次飞跃，其强大的推理能力为我们描绘出了下一代人工智能模型的未来图景。近日，伦敦大学学院（UCL）人工智能中心汪军教授撰写了一份「LLM 推理教程」，深入详细地介绍了 OpenAI ο1 模型背后的相关方法。

来自主题: AI资讯

3751 点击 2024-10-11 14:42

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

本文是一篇发表在 NeurIPS 2024 上的论文，单位是香港大学、Sea AI Lab、Contextual AI 和俄亥俄州立大学。论文主要探讨了大型语言模型（LLMs）的词表大小对模型性能的影响。

来自主题: AI技术研报

6452 点击 2024-10-11 13:55

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

4949 点击 2024-10-10 17:17

CMU副教授：在多智能体流行的当下，不要忽视单智能体系统

「多智能体系统」是人工智能领域最热门的流行词之一，也是开源框架 MetaGPT 、 Autogen 等研究的焦点。但是，多智能体系统就一定是完美的吗近日，来自卡内基梅隆大学的副教授 Graham Neubig 在文章《Don't Sleep on Single-agent Systems》中强调了单智能体系统也不可忽视。

来自主题: AI资讯

3936 点击 2024-10-10 17:06