AI资讯新闻榜单内容搜索-语言模型

AI Agent、传统聊天机器人有何区别？如何评测？这篇30页综述讲明白了

自从 Transformer 问世，NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力，成为现代 AI 系统的基础。而今，AI 正不断向前，具备自主决策和复杂交互能力的新一代 AI Agent 也正加速崛起。

来自主题: AI技术研报

6491 点击 2025-07-03 10:31

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报

9795 点击 2025-07-03 10:00

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

如果一个视觉语言模型（VLM）只会“看”，那真的是已经不够看的了。

来自主题: AI技术研报

10287 点击 2025-07-02 15:56

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

中科院自动化所提出DipLLM，这是首个在复杂策略游戏Diplomacy中基于大语言模型微调的智能体框架，仅用Cicero 1.5%的训练数据就实现超越

来自主题: AI资讯

9066 点击 2025-07-01 15:30

只用2700万参数，这个推理模型超越了DeepSeek和Claude

像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报

7907 点击 2025-07-01 10:26

疯狂挖人之后，小扎刚刚官宣超级智能 AI 梦之队，华人占大半 | 附 11 人核心名单

在长达数周的高强度「挖角」之后，Meta 今天凌晨宣布正式成立超级智能实验室（Meta Superintelligence Labs，简称 MSL）。Meta CEO 马克·扎克伯格在当时时间周一发布的一封内部信中透露，MSL 将整合公司现有的基础 AI 研究（FAIR）、大语言模型开发以及 AI 产品团队，并组建一个专门研发下一代 AI 模型的新实验室。

来自主题: AI资讯

10020 点击 2025-07-01 09:04