AI资讯新闻榜单内容搜索-LLM

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

原来，CoT推理竟是假象！Bengio带队最新论文戳穿了CoT神话——我们所看到的推理步骤，并非是真实的。不仅如此，LLM在推理时会悄然纠正错误，却在CoT中只字未提。

来自主题: AI技术研报

9737 点击 2025-07-03 11:09

多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器，从而在长文本与大数据场景中降低算力成本。LIFT首次系统性地剖析了此范式的优势来源、数据适配性、以及关键设计选择，在组合语义理解与长文本任务上观察到大幅提升。

来自主题: AI技术研报

7772 点击 2025-07-03 11:00

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报

9547 点击 2025-07-03 10:00

中科院自动化所提出DipLLM，这是首个在复杂策略游戏Diplomacy中基于大语言模型微调的智能体框架，仅用Cicero 1.5%的训练数据就实现超越

来自主题: AI资讯

8845 点击 2025-07-01 15:30

像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报

7700 点击 2025-07-01 10:26

尽管大型语言模型（LLMs）和大型视觉 - 语言模型（VLMs）在视频分析和长语境处理方面取得了显著进展，但它们在处理信息密集的数小时长视频时仍显示出局限性。

来自主题: AI技术研报

7697 点击 2025-06-30 14:34

继女皇报告后，硅谷财富管理巨头Iconiq Capital发布《2025年AI现状报告》！实测300家AI公司落地路径，聚焦成本结构、技术选型与人才构建，揭示AI从概念走向实战的七大真问题。

来自主题: AI资讯

8941 点击 2025-06-30 14:20

What？LLM也要看出身！确实，不同的数据集训出的模型“个性”会有大不同，尤其在加之权衡方面。这就像我们经常与自己内心相互竞争的目标和价值观作斗争。

来自主题: AI资讯

6897 点击 2025-06-30 11:24

这两天 Andrej Karpathy 的最新演讲在 AI 社区引发了热烈讨论，他提出了「软件 3.0」的概念，自然语言正在成为新的编程接口，而 AI 模型负责执行具体任务。

来自主题: AI资讯

8023 点击 2025-06-29 16:53

今天，著名的人工智能学者和认知科学家 Gary Marcus 转推了 MIT、芝加哥大学、哈佛大学合著的一篇爆炸性论文，称「对于 LLM 及其所谓能理解和推理的神话来说，情况变得更糟了 —— 而且是糟糕得多。」

来自主题: AI技术研报

6721 点击 2025-06-29 16:11