AI资讯新闻榜单内容搜索-AR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AR
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

在多模态大模型快速发展的当下,如何精准评估其生成内容的质量,正成为多模态大模型与人类偏好对齐的核心挑战。然而,当前主流多模态奖励模型往往只能直接给出评分决策,或仅具备浅层推理能力,缺乏对复杂奖励任务的深入理解与解释能力,在高复杂度场景中常出现 “失真失准”。

来自主题: AI技术研报
10085 点击    2025-05-14 11:01
一手实测深夜发布的世界首个设计Agent - Lovart。

一手实测深夜发布的世界首个设计Agent - Lovart。

一手实测深夜发布的世界首个设计Agent - Lovart。

说个超级有意思的事。 今天凌晨,一个AI设计类的垂直Agent工具,在X上爆了。

来自主题: AI资讯
8980 点击    2025-05-13 16:45
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。

来自主题: AI技术研报
8394 点击    2025-05-12 14:51
一个「always」站在大模型技术C位的传奇男子

一个「always」站在大模型技术C位的传奇男子

一个「always」站在大模型技术C位的传奇男子

怎么老是你???(How old are you)尤其是最近Meta FAIR研究员朱泽园分享了他们《Physics of Language Models》项目的系列新进展后,有网友发现,其中提到的3-token因果卷积相关内容,沙哥等又早在三年前就有相关研究。这是最近网友不断对着Transformer八子之一的Noam Shazeer(为方便阅读,我们称他为沙哥)发出的灵魂疑问。

来自主题: AI资讯
10414 点击    2025-05-11 15:02
AI冷战升级!美国财政部开始审查Benchmark投资Manus,套壳应用也无法躲避科技地缘政治风暴

AI冷战升级!美国财政部开始审查Benchmark投资Manus,套壳应用也无法躲避科技地缘政治风暴

AI冷战升级!美国财政部开始审查Benchmark投资Manus,套壳应用也无法躲避科技地缘政治风暴

根据TechCrunch和Semafor等报道,美国财政部正在审查Benchmark Capital对中国初创公司Manus AI的7500万美元投资,据两位知情人士透露,这已经反映出中美之间的科技竞争已经升级到政治层面。

来自主题: AI资讯
12002 点击    2025-05-10 22:48
机器人的「物理图灵测试」,英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

机器人的「物理图灵测试」,英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

机器人的「物理图灵测试」,英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

Jim Fan,英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生,最近在红杉资本主办的 AI Ascent 上做了一场 17 分钟的演讲

来自主题: AI技术研报
8157 点击    2025-05-10 15:59
OpenAI和Google正在玩一个99%的人都不知道的游戏

OpenAI和Google正在玩一个99%的人都不知道的游戏

OpenAI和Google正在玩一个99%的人都不知道的游戏

AI研究中,基准测试(benchmark)和排行榜在评估模型性能上扮演着关键角色。

来自主题: AI技术研报
8872 点击    2025-05-10 14:29