AI资讯新闻榜单内容搜索-工智能

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 工智能
让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

让AI给林黛玉找个外国平替?大模型的文科推理有多离谱?

如果你让大模型给林黛玉找一个外国文学里的平替,它能给出令人信服的答案吗?这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

来自主题: AI技术研报
8862 点击    2026-05-11 16:47
ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

近年来,大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架,Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报
5773 点击    2026-05-11 16:09
Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Agent评测的下半场:为什么需要一个「活的」Benchmark?

Claw-Eval-Live提出「活的」benchmark概念,通过信号采集与任务筛选,确保评测内容紧跟企业实际痛点,而非固定不变的题库。评测不仅关注结果,还追踪执行过程,从数据调用到状态变更,全面验证Agent的真实能力。

来自主题: AI技术研报
6205 点击    2026-05-11 16:08
Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

NVIDIA Dynamo 团队发现,Claude Code 向自定义端点发送请求时,prompt 最前面会带一行 session-specific billing header。这行 header 每个 session 都变,导致 52K token 的稳定前缀在 KV cache 中无法复用——TTFT 从 168ms 飙到 912ms。Dynamo 加了一个 `

来自主题: AI资讯
10062 点击    2026-05-11 11:01
谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

谷歌DeepMind聘请芝大教授担任AGI经济总监:审视AI时代人的价值

DeepMind 刚上任的 AGI 经济学总监 Alex Imas 曾担忧 AI 导致失业和需求坍缩,如今提出一个谨慎乐观判断,AI 会压低可复制劳动价格,也会推高护理、教育、医疗、服务等关系型劳动的价值。

来自主题: AI资讯
5982 点击    2026-05-11 09:34
残酷真相:硅谷顶尖AI甩开世界1年!你用的不过是「技术余晖」

残酷真相:硅谷顶尖AI甩开世界1年!你用的不过是「技术余晖」

残酷真相:硅谷顶尖AI甩开世界1年!你用的不过是「技术余晖」

顶级大佬Elad Gil抛出残酷真相:顶级实验室员工领先硅谷4个月,硅谷领先世界1年。你引以为傲的SOTA,在实验室里可能早已是淘汰的旧引擎。

来自主题: AI资讯
7086 点击    2026-05-11 09:34
Z Product | AI Native教育产品爆火:海外播放破5000 万,20岁天才退学联手前Google专家打造

Z Product | AI Native教育产品爆火:海外播放破5000 万,20岁天才退学联手前Google专家打造

Z Product | AI Native教育产品爆火:海外播放破5000 万,20岁天才退学联手前Google专家打造

几天内席卷 Instagram 与 TikTok,海外播放突破 5000 万;用户可上传题目、选择喜欢的 AI Tutor 角色,并实时互动生成个性化视频讲解,让学习像刷短视频一样停不下来,验证了 AI-native 教育产品的新形态。

来自主题: AI资讯
9204 点击    2026-05-11 09:04
告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

告别Prompt抽卡和评分通胀:一个让AI游戏真正「机制化迭代」的框架

让大模型写一个小游戏,已经不新鲜了。它可以很快生成一个 Flappy Bird、一个塔防游戏、一个物理解谜页面,甚至还能补上按钮、分数和简单动画。但真正的问题是:这些游戏到底有没有新的玩法?它们是在创造,亦或只是把已有游戏换了一层皮?

来自主题: AI技术研报
10254 点击    2026-05-11 09:02
反超美国!中国43.7%霸榜ICLR 2026,清北交浙全球最多

反超美国!中国43.7%霸榜ICLR 2026,清北交浙全球最多

反超美国!中国43.7%霸榜ICLR 2026,清北交浙全球最多

ICLR 2026,全球AI三大顶会之一,刚刚在巴西里约落幕。有社区研究者逐篇扒开5356篇被接收论文PDF首页、提取机构署名、清洗归一后,一张Treemap热力图炸翻了整个学术圈:中国大陆,43.7%。美国,31.9%。欧洲(含英国),5.3%。

来自主题: AI资讯
7590 点击    2026-05-10 16:08
刚刚,硅谷这篇文章刷屏了!

刚刚,硅谷这篇文章刷屏了!

刚刚,硅谷这篇文章刷屏了!

今天,硅谷一篇长文《The next biggest moat in AI》刷屏了,作者是 Foundation Capital 合伙人、前麦肯锡咨询师 Jaya Gupta。这篇文章在 X 上 12 小时获得了130万阅读,被一群创始人和打工人同时转发,原因是它同时提供了两套视角:

来自主题: AI资讯
8665 点击    2026-05-10 14:43