AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

如果你让大模型给林黛玉找一个外国文学里的平替,它能给出令人信服的答案吗?这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

来自主题: AI技术研报
8762 点击    2026-05-11 16:47
在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

在模型厂碾压之前,AI视频Agent产品是否只能挣波快钱?

这是一个“等待被大厂吞没”的行业,还是可能长出像Adobe那样的工具型公司?

来自主题: AI资讯
7348 点击    2026-05-11 16:09
百年同仁堂变了!牵手阿里玩起AI养生,年轻人彻底入坑

百年同仁堂变了!牵手阿里玩起AI养生,年轻人彻底入坑

百年同仁堂变了!牵手阿里玩起AI养生,年轻人彻底入坑

4月5日至5月5日,北京同仁堂与阿里生态下的淘宝买药、夸克、飞猪及高德地图展开了一场为期一个月的深度联动。

来自主题: AI资讯
8609 点击    2026-05-11 16:09
ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

近年来,大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架,Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报
5639 点击    2026-05-11 16:09
Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Claw-Eval-Live提出「活的」benchmark概念,通过信号采集与任务筛选,确保评测内容紧跟企业实际痛点,而非固定不变的题库。评测不仅关注结果,还追踪执行过程,从数据调用到状态变更,全面验证Agent的真实能力。

来自主题: AI技术研报
6069 点击    2026-05-11 16:08
CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

CVPR 2026 | 别卷推理了!当前大模型 STEM 短板在于「视觉感知」,代码才是破局关键

当多模态大语言模型(MLLMs)在面对科学、技术、工程和数学(STEM)领域的视觉推理题时频频「翻车」,一个根本性的问题摆在了所有研究者面前:大模型做不出理科题,究竟是因为「脑子笨」(推理能力受限),还是因为「眼神差」(视觉感知缺陷)?

来自主题: AI技术研报
6531 点击    2026-05-11 16:08
独家对话姚顺宇:请允许我小疯一下

独家对话姚顺宇:请允许我小疯一下

独家对话姚顺宇:请允许我小疯一下

他人生最大的一次跨步是博士毕业,毅然决然离开深造9年的物理,来到崭新的AI行业。过去两年,他先后在Anthropic和Google DeepMind出任研究科学家,参与了Claude 3.7、4.5、Gemini 3等关键模型的开发过程。

来自主题: AI资讯
10736 点击    2026-05-11 12:03
独家| 95后港中文博士融资数百万美金,FitX AI 打造全球首个AI Native家庭娱乐入口

独家| 95后港中文博士融资数百万美金,FitX AI 打造全球首个AI Native家庭娱乐入口

独家| 95后港中文博士融资数百万美金,FitX AI 打造全球首个AI Native家庭娱乐入口

飞拓星驰(FitX AI)宣布完成数百万美金融资,由日初资本领投,光点资本跟投。这笔融资将用于Fit-OS空间智能 Agent 平台的研发,以及首款客厅 AI Native 终端的量产准备——预计 2027 年 CES 全球首发。

来自主题: AI资讯
8441 点击    2026-05-11 11:03