AI资讯新闻榜单内容搜索-LLMs

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLMs

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报

7423 点击 2025-07-03 10:00

微软推出深度视频探索智能体，登顶多个长视频理解基准

微软推出深度视频探索智能体，登顶多个长视频理解基准

微软推出深度视频探索智能体，登顶多个长视频理解基准

尽管大型语言模型（LLMs）和大型视觉 - 语言模型（VLMs）在视频分析和长语境处理方面取得了显著进展，但它们在处理信息密集的数小时长视频时仍显示出局限性。

来自主题: AI技术研报

6113 点击 2025-06-30 14:34

ICML 2025 | 打破残差连接瓶颈，彩云科技&北邮提出MUDDFormer架构让Transformer再进化！

ICML 2025 | 打破残差连接瓶颈，彩云科技&北邮提出MUDDFormer架构让Transformer再进化！

ICML 2025 | 打破残差连接瓶颈，彩云科技&北邮提出MUDDFormer架构让Transformer再进化！

但在当今的深度 Transformer LLMs 中仍有其局限性，限制了信息在跨层间的高效传递。彩云科技与北京邮电大学近期联合提出了一个简单有效的残差连接替代：多路动态稠密连接（MUltiway Dynamic Dense (MUDD) connection），大幅度提高了 Transformer 跨层信息传递的效率。

来自主题: AI技术研报

5693 点击 2025-06-28 11:33

AI 开始「自由玩电脑」了！吉大提出「屏幕探索者」智能体

AI 开始「自由玩电脑」了！吉大提出「屏幕探索者」智能体

AI 开始「自由玩电脑」了！吉大提出「屏幕探索者」智能体

迈向通用人工智能（AGI）的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。随着大语言模型（LLMs）和视觉语言模型（VLMs）的飞速发展，智能体已展现出令人瞩目的跨领域任务泛化能力。

来自主题: AI技术研报

6157 点击 2025-06-28 11:18

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

LLMs能当科研助手了？北大出考题，结果显示：现有模型都不能胜任。

来自主题: AI技术研报

8237 点击 2025-06-27 10:06

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

LLM进入「拖拽时代」！只靠Prompt，几秒定制一个大模型，效率飙升12000倍

最近，来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」（DnD），它可以基于提示词快速生成模型参数，无需微调就能适应任务。不仅效率最高提升12000倍，而且具备出色的零样本泛化能力。

来自主题: AI技术研报

7333 点击 2025-06-24 14:26

性能提升11.74%！腾讯优图提出激励推理，专攻复杂指令

性能提升11.74%！腾讯优图提出激励推理，专攻复杂指令

性能提升11.74%！腾讯优图提出激励推理，专攻复杂指令

现有的语言大模型（LLMs）在复杂指令下的理解和执行能力仍需提升。

来自主题: AI技术研报

6760 点击 2025-06-24 10:10

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

在 ChatGPT 等大语言模型（LLMs）席卷全球的今天，越来越多的研究者意识到：我们需要的不只是 “会说话” 的 LLM，更是 “能解释” 的 LLM。

来自主题: AI技术研报

7896 点击 2025-06-22 16:25

知识储备≠模型能力！DeepMind强化学习微调：大幅缩小「知行差距」

知识储备≠模型能力！DeepMind强化学习微调：大幅缩小「知行差距」

知识储备≠模型能力！DeepMind强化学习微调：大幅缩小「知行差距」

大语言模型（LLMs）在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调（RLFT），通过自我生成的推理链（CoT）优化模型，提升决策能力。实验表明，RLFT可增加模型探索性，缩小知行差距，但探索策略仍有改进空间。

来自主题: AI技术研报

6206 点击 2025-06-22 11:34

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

思维链（Chain of Thought, CoT）推理方法已被证明能够显著提升大语言模型（LLMs）在复杂任务中的表现。而在多模态大语言模型（MLLMs）中，CoT 同样展现出了巨大潜力。

来自主题: AI技术研报

8222 点击 2025-06-17 10:21

上一页当前第2页,共16页下一页