AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?

ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?

ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?

近年来,大型语言模型(LLMs)在复杂推理任务中展现出惊人的能力,这在很大程度上得益于过程级奖励模型(PRMs)的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」,负责评估推理过程的每一步,以引导模型的学习方向。

来自主题: AI技术研报
6002 点击    2025-07-28 10:49
首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

新一代大型推理模型,如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5,在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法,即采用可验证奖励强化学习(RLVR)逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。

来自主题: AI技术研报
5240 点击    2025-07-28 10:36
AI会谄媚用户的原因,竟然是不够“普信”

AI会谄媚用户的原因,竟然是不够“普信”

AI会谄媚用户的原因,竟然是不够“普信”

目前将AI当作能力更强的信息提供者,才是个最好的选择。 AI正在变得越来越有“人味”,偷懒、撒谎、谄媚等现象的出现使得让AI不再只是冷冰冰的机器。如果说OpenAI o3等模型篡改代码拒绝关机指令是“求生本能”在作祟,那么AI又为何会化身“赛博舔狗”,选择近乎无底线地迎合用户呢?

来自主题: AI资讯
5391 点击    2025-07-28 10:35
港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

在复杂的开放环境中,让足式机器人像人类一样自主完成「先跑到椅子旁,再快速接近行人」这类长程多目标任务,一直是 robotics 领域的棘手难题。传统方法要么局限于固定目标类别,要么难以应对运动中的视觉抖动、目标丢失等实时挑战,导致机器人在真实场景中常常「迷路」或「认错对象」。

来自主题: AI技术研报
5661 点击    2025-07-28 10:29
豆包上新同声传译,顺便狙击阿里AI眼镜?

豆包上新同声传译,顺便狙击阿里AI眼镜?

豆包上新同声传译,顺便狙击阿里AI眼镜?

AI语音成大厂必争之地 打开字节、阿里们的多模态能力地图,每块宝藏都标着"语音”。

来自主题: AI资讯
5487 点击    2025-07-28 10:23
AI透镜系列研究:AI Coding非共识报告

AI透镜系列研究:AI Coding非共识报告

AI透镜系列研究:AI Coding非共识报告

超越软件的编程范式革命 长久以来,编程被定义为一种严谨的、逻辑驱动的活动,是将人类意图转化为机器可执行的、确定性指令的过程。然而,AI正在颠覆这一核心定义,将编程从“Coding”这一动作,提升到“表达意图”和“实现愿景”的更高维度。

来自主题: AI资讯
6545 点击    2025-07-28 10:16
离线+记忆,大模型进化的分水岭

离线+记忆,大模型进化的分水岭

离线+记忆,大模型进化的分水岭

下一代通用人工智能的基石:大模型记忆机制。今年的WAIC,依旧火爆。 闷热的上海、拥挤的展台、扎堆的AI大模型——这些都是历年WAIC的常态,但今年有些变化。

来自主题: AI资讯
5922 点击    2025-07-28 10:05
万亿美元新大陆!谁将主宰「人机共生」智能体经济时代?

万亿美元新大陆!谁将主宰「人机共生」智能体经济时代?

万亿美元新大陆!谁将主宰「人机共生」智能体经济时代?

当AI从单一模型迈向多智能体协同的时代,一场以「人机共生、生态自治」为核心的经济革命正悄然兴起。一起深入揭秘,Agent工厂与Agent市场如何成为这场变革的双引擎。

来自主题: AI资讯
7695 点击    2025-07-28 09:55
【实测】MiniMax Agent 把前端+后端+模型+UI 一口气全包了,我直接人傻了

【实测】MiniMax Agent 把前端+后端+模型+UI 一口气全包了,我直接人傻了

【实测】MiniMax Agent 把前端+后端+模型+UI 一口气全包了,我直接人傻了

还记得上周我刚给同事安利Bolt.new的时候,我们还在感叹:这玩意儿真的能干掉一大半前端。而现在,我得改口了: MiniMax Agent直接把整个“全栈开发”都干掉了。

来自主题: AI资讯
5575 点击    2025-07-28 09:52