AI资讯新闻榜单内容搜索-Arc

Video版的Deep Research来了？先浏览再定位后精读：精度提升token消耗反降58.3%

在当前的AI Research浪潮中，Autonomous Agents已经改变了我们获取信息的方式——从被动接收到主动检索。

来自主题: AI技术研报

9367 点击 2026-01-22 16:13

视频理解+开放网络搜索=首个视频Deep Research评测基准

现有的多模态模型往往被困在「视频」的孤岛里——它们只能回答视频内的问题。但在真实世界中，人类解决问题往往是「看视频找线索 -> 上网搜证 -> 综合推理」。

来自主题: AI技术研报

11344 点击 2026-01-22 16:10

Gemini准确率从21%飙到97%！谷歌只用了这一招：复制粘贴

简单到难以置信！近日，Google Research一项新研究发现：想让大模型在不启用推理设置时更准确，只需要把问题复制粘贴再说一遍，就能把准确率从21.33%提升到97.33%！

来自主题: AI技术研报

10414 点击 2026-01-18 14:58

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

香港大学（The University of Hong Kong）与 Adobe Research 联合发布 Self-E（Self-Evaluating Model）：一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接：让同一个模型在极少步数也能生成语义清晰、结构稳定的图像，同时在 50 步等常规设置下保持顶级质量，并且随着步数增加呈现单调提升。

来自主题: AI技术研报

9628 点击 2026-01-18 14:57

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

作者来自 Nanyang Technological University（MMLab）与 SenseTime Research，提出 Prism Hypothesis（棱镜假说）与 Unified Autoencoding（UAE），尝试用 “频率谱” 的统一视角，把语义编码器与像素编码器的表示冲突真正 “合并解决”。

来自主题: AI技术研报

11161 点击 2026-01-15 09:20

AI医疗，最正宗的十家公司！

据Grand View Research报告，2024年全球AI医疗市场规模约为266.5亿美元（约合人民币1861亿元），预计到2033年将飙升至约5055.9亿美元（约合人民币3.5万亿元），年复合增长率达38.8%。

来自主题: AI资讯

11396 点击 2026-01-11 21:42

GPT-5.2考赢人类！OpenAI警告：大模型能力已过剩，AGI天花板不是AI

刚刚，GPT-5.2刷新了一项新纪录！OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上，表现超过了人类基线水平。

来自主题: AI资讯

11232 点击 2026-01-11 10:10

信息论证明，小模型跑在本地才是Agent的终极解法｜斯坦福重磅

在近一年里，Agentic System（代理系统/智能体系统）正变得无处不在。从Open AI的Deep Research到Claude Code，我们看到越来越多的系统不再依赖单一模型，而是通过多模型协作来完成复杂的长窗口任务。

来自主题: AI技术研报

9913 点击 2026-01-04 10:20

0.002美元撬动顶级研究力，开源AI助手匹敌OpenAI商用系统

近日，美国华盛顿大学博士生邵如琳和合作团队打造出一个名为 Deep Research Tulu（DR Tulu）的深度研究小助手。使用一次 OpenAI 的 Deep Research 服务可能需要大约 1.8 美元，而 DR Tulu 使用一次的成本却不到 0.002 美元，这几乎是千倍的效率提升，这意味着未来个人或者小团队也能负担得起高质量、高可信度的 AI 研究服务。

来自主题: AI资讯

9100 点击 2026-01-02 15:04

系统学习Deep Research，这一篇综述就够了

近年来，大模型的应用正从对话与创意写作，走向更加开放、复杂的研究型问题。尽管以检索增强生成（RAG）为代表的方法缓解了知识获取瓶颈，但其静态的 “一次检索 + 一次生成” 范式，难以支撑多步推理与长期

来自主题: AI技术研报

8502 点击 2026-01-02 15:01