AI资讯新闻榜单内容搜索-模型训练

GPT-5准确率不足40%！北大发布多模态、高难度化学基准SUPERChem

北大团队发布化学大模型基准SUPERChem，这是一个多模态、高难度的化学推理基准。它针对现有化学评测的不足，系统构建了评估大语言模型化学推理能力的新体系。

来自主题: AI技术研报

9415 点击 2025-12-15 15:16

8B模型任务击败GPT-5？阶跃星辰开源Deep Think新框架，小模型解锁百万Token测试时计算

8B 模型在数学竞赛任务上超越 GPT-5！

来自主题: AI技术研报

9909 点击 2025-12-15 14:54

SIGGRAPH Asia 2025｜30FPS普通相机恢复200FPS细节，4D重建方案来了

当古装剧中的长袍在武林高手凌空翻腾的瞬间扬起 0.01 秒的惊艳弧度，当 VR 玩家想伸手抓住对手 “空中定格” 的剑锋，当 TikTok 爆款视频里一滴牛奶皇冠般的溅落要被 360° 无死角重放 —— 如何用普通的摄像机，把瞬间即逝的高速世界 “冻结” 成可供反复拆解、传送与交互的数字化 4D 时空，成为 3D 视觉领域的一个难题。

来自主题: AI技术研报

8431 点击 2025-12-15 14:50

OpenAI突然开源新模型！99.9%的权重是0，新稀疏性方法代替MoE

破解AI胡说八道的关键，居然是给大模型砍断99.9%的连接线？

来自主题: AI技术研报

9315 点击 2025-12-15 12:20

6位前DeepMind老将打造「AI指挥官」，一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式，该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首，而成本仅为此前最优方法的一半。

来自主题: AI技术研报

7983 点击 2025-12-15 11:31

谢赛宁REPA得到大幅改进，只需不到4行代码

邹忌曾经有一个问题：吾与徐公孰美？

来自主题: AI技术研报

9757 点击 2025-12-15 10:39

全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔

在 Physical Intelligence 最新的成果 π0.6 论文里，他们介绍了 π0.6 迭代式强化学习的思路来源：

来自主题: AI技术研报

8660 点击 2025-12-15 09:58

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？

来自主题: AI技术研报

9748 点击 2025-12-15 09:53

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

在深入技术细节之前，我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案：正如钟离在漫画中所言，面对海量视觉指令数据的选择任务，传统方法需要遍历全部数据才能进行筛选造成大量「磨损」（高昂计算成本）。同时在面对数据重要性和多样性问题时，传统方法往往顾此失彼。

来自主题: AI技术研报

6788 点击 2025-12-14 10:46

港大开源ViMax火了，实现AI自编自导自演

想象一下，只需要一句话描述，AI 就能为你拍出一部完整的短剧？为了让这个想法变成现实，香港大学黄超教授团队开源了 ViMax 框架，并在 GitHub 获得 1.4k + 星标，专注于 Agentic Video Generation 的前沿探索。通过多智能体协作，ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化，把传统影视制作的每个环节都搬进了 AI 世界。

来自主题: AI技术研报

8519 点击 2025-12-13 11:06