AI资讯新闻榜单内容搜索-模型

国产AI拿下国际物理奥赛金牌，13项顶级竞赛豪取12金1银，划重点：开源

首个拿下国际物理奥林匹克竞赛IPhO 2025理论考试金牌的开源模型，出自国产。上海人工智能实验室团队推出新模型家族，代号P1。在IPhO 2025理论考试中，P1-235B-A22B取得21.2/30分，成为首个达到该金牌线的开源模型，仅次于Gemini-2.5-Pro与GPT-5。

来自主题: AI技术研报

8345 点击 2025-11-22 11:37

“美国公司制造的最好开源模型”，基模来自DeepSeek

总部位于旧金山的初创公司 Deep Cogito 发布了其最新一代旗舰模型 Cogito v2.1 671B。公司 CEO Drishan Arora 在社交平台 X 上豪情万丈地宣布：“今天，我们发布了由美国公司制造的最好的开源大语言模型。”

来自主题: AI资讯

8572 点击 2025-11-22 11:36

AI问答，直接「拍」给你看！来自快手可灵&香港城市大学

今天，来自快手可灵团队和香港城市大学的研究者们，正在尝试打破这一界限。他们提出了一个全新的任务范式——「视频作为答案」，并发布了相应模型VANS。而这项工作则开创性地提出了Video-Next Event Prediction任务，要求模型直接生成一段动态视频作为回答。

来自主题: AI技术研报

8677 点击 2025-11-22 11:34

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

就在一周前，全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型，好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化，扩展到图像与视频扩散模型上，相较于先前的视频和图像生成框架，速度提升最高可达 57%：

来自主题: AI技术研报

8315 点击 2025-11-22 11:33

GPT-5得分不到0.4！法律+金融最大规模基准：1.9万+专家评估准则

最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示，即使是顶尖大模型在处理复杂任务时也表现不佳，尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话，揭示了AI在专业领域的不足，强调开发更可靠AI系统的重要性。

来自主题: AI技术研报

7727 点击 2025-11-22 11:33

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

7352 点击 2025-11-22 11:31

Agent出海踩坑实录

“我曾经花了5个月，做了一款没人用的大模型。”去年4月，刘天强期待拿下美国一家快时尚零售公司的大单，为对方开发一款用AI生成产品上身图的B端产品。带着团队干了整整5个月，产品迭代的重要关头，刘天强没等来最后的签单通知，却等来了客户公司被并购、项目中止的消息。

来自主题: AI资讯

8728 点击 2025-11-21 22:28

AI模型大战：Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择？

前沿AI竞赛在2025年11月达到高潮。48小时内，谷歌推出Gemini 3 Pro宣称在主要推理基准测试中领先，而OpenAI立即用GPT-5.1-Codex-Max反击，这是一款专门训练用于通过创新"压缩"（compaction）技术自主工作超过24小时的专业编码模型[43]。加上Claude Sonnet 4.5已确立的编码统治地位和激进的安全过滤器，开发者面临前所未有的选择：

来自主题: AI技术研报

11330 点击 2025-11-21 17:09

4K超分Agent修图师来了！一键救活所有模糊照片

由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大学奥斯汀分校、加州理工大学、Topaz Labs以及加州大学Merced分校的研究者联合提出的基于AI智能体的方法4KAgent针对不同类型的图像以及需求对图像进行智能修复并放大到4K分辨率，带来优秀的视觉感知效果。该工作已被NeurIPS 2025接收。

来自主题: AI技术研报

8332 点击 2025-11-21 17:03

Nano Banana Pro上线！集成Gemini 3与Veo 3，谷歌不给竞争对手喘息机会

谷歌乘胜追击！Gemini 3 Pro好评如潮没两天，最强文生图模型Nano Banana也推出Pro版本。

来自主题: AI资讯

8193 点击 2025-11-21 10:54