AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

这是一个“等待被大厂吞没”的行业,还是可能长出像Adobe那样的工具型公司?

来自主题: AI资讯
7663 点击    2026-05-11 16:09
ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

近年来,大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架,Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报
6006 点击    2026-05-11 16:09
Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Claw-Eval-Live提出「活的」benchmark概念,通过信号采集与任务筛选,确保评测内容紧跟企业实际痛点,而非固定不变的题库。评测不仅关注结果,还追踪执行过程,从数据调用到状态变更,全面验证Agent的真实能力。

来自主题: AI技术研报
6409 点击    2026-05-11 16:08
CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

当多模态大语言模型(MLLMs)在面对科学、技术、工程和数学(STEM)领域的视觉推理题时频频「翻车」,一个根本性的问题摆在了所有研究者面前:大模型做不出理科题,究竟是因为「脑子笨」(推理能力受限),还是因为「眼神差」(视觉感知缺陷)?

来自主题: AI技术研报
6859 点击    2026-05-11 16:08
独家对话姚顺宇:请允许我小疯一下

独家对话姚顺宇:请允许我小疯一下

独家对话姚顺宇:请允许我小疯一下

他人生最大的一次跨步是博士毕业,毅然决然离开深造9年的物理,来到崭新的AI行业。过去两年,他先后在Anthropic和Google DeepMind出任研究科学家,参与了Claude 3.7、4.5、Gemini 3等关键模型的开发过程。

来自主题: AI资讯
11862 点击    2026-05-11 12:03
GENE-26.5 刷屏,堪称今年领域最震撼的demo!真的吗?

GENE-26.5 刷屏,堪称今年领域最震撼的demo!真的吗?

GENE-26.5 刷屏,堪称今年领域最震撼的demo!真的吗?

GENE-26.5 值得看的,是它背后的「具身智能版 Harness + 模型」。

来自主题: AI技术研报
6351 点击    2026-05-11 09:04
大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型常因只关注当前预测而显得短视。Next-ToBE通过调整训练目标,让模型在每一步预测时兼顾未来token分布,从而提升整体推理能力。

来自主题: AI技术研报
6695 点击    2026-05-11 09:03