AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？

来自主题: AI技术研报

10851 点击 2025-12-15 09:53

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

在深入技术细节之前，我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案：正如钟离在漫画中所言，面对海量视觉指令数据的选择任务，传统方法需要遍历全部数据才能进行筛选造成大量「磨损」（高昂计算成本）。同时在面对数据重要性和多样性问题时，传统方法往往顾此失彼。

来自主题: AI技术研报

7982 点击 2025-12-14 10:46

港大开源ViMax火了，实现AI自编自导自演

港大开源ViMax火了，实现AI自编自导自演

港大开源ViMax火了，实现AI自编自导自演

想象一下，只需要一句话描述，AI 就能为你拍出一部完整的短剧？为了让这个想法变成现实，香港大学黄超教授团队开源了 ViMax 框架，并在 GitHub 获得 1.4k + 星标，专注于 Agentic Video Generation 的前沿探索。通过多智能体协作，ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化，把传统影视制作的每个环节都搬进了 AI 世界。

来自主题: AI技术研报

9997 点击 2025-12-13 11:06

多智能体一定比单智能体要好？Google最新研究：并非如此！

多智能体一定比单智能体要好？Google最新研究：并非如此！

多智能体一定比单智能体要好？Google最新研究：并非如此！

最近，来自Google Research、Google DeepMind和MIT的研究者们联合发表了一项重磅研究。结果显示：盲目增加智能体数量，在很多时候不仅没用，反而会让系统变笨、变慢、变贵。

来自主题: AI技术研报

8044 点击 2025-12-13 11:00

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

扩散语言模型（Diffusion Language Models）以其独特的 “全局规划” 与并行解码能力广为人知，成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下，其通常面临

来自主题: AI技术研报

8552 点击 2025-12-13 10:59

NUS LV Lab新作｜FeRA：基于「频域能量」动态路由，打破扩散模型微调的静态瓶颈

NUS LV Lab新作｜FeRA：基于「频域能量」动态路由，打破扩散模型微调的静态瓶颈

NUS LV Lab新作｜FeRA：基于「频域能量」动态路由，打破扩散模型微调的静态瓶颈

新加坡国立大学 LV Lab（颜水成团队）联合电子科技大学、浙江大学等机构提出 FeRA (Frequency-Energy Constrained Routing) 框架：首次从频域能量的第一性原理出发，揭示了扩散去噪过程具有显著的「低频到高频」演变规律，并据此设计了动态路由机制。

来自主题: AI技术研报

7967 点击 2025-12-12 15:34

谷歌发布智能体Scaling Law：180组实验打破传统炼金术

谷歌发布智能体Scaling Law：180组实验打破传统炼金术

谷歌发布智能体Scaling Law：180组实验打破传统炼金术

智能体（Agent），即基于语言模型且具备推理、规划和行动能力的系统，正在成为现实世界 AI 应用的主导范式。

来自主题: AI技术研报

7260 点击 2025-12-12 10:27

GPT在模仿人类？Nature发现：大脑才是最早的Transformer！

GPT在模仿人类？Nature发现：大脑才是最早的Transformer！

GPT在模仿人类？Nature发现：大脑才是最早的Transformer！

我们以为语言是语法、规则、结构。但最新的Nature研究却撕开了这层幻觉。GPT的层级结构与竟与人大脑里的「时间印记」一模一样。当浅层、中层、深层在脑中依次点亮，我们第一次看见：理解语言，也许从来不是解析，而是预测。

来自主题: AI技术研报

10112 点击 2025-12-12 09:39

效率提升25%，灵巧操作数采困境被「臂-手共享自主框架」解决

效率提升25%，灵巧操作数采困境被「臂-手共享自主框架」解决

效率提升25%，灵巧操作数采困境被「臂-手共享自主框架」解决

实现通用机器人的类人灵巧操作能力，是机器人学领域长期以来的核心挑战之一。近年来，视觉 - 语言 - 动作 (Vision-Language-Action，VLA) 模型在机器人技能学习方面展现出显著潜力，但其发展受制于一个根本性瓶颈：高质量操作数据的获取。

来自主题: AI技术研报

10155 点击 2025-12-12 09:38

纯文本驱动视频编辑，清华&华为&中科大实现无需掩码/参考帧就能精准移除/添加对象

纯文本驱动视频编辑，清华&华为&中科大实现无需掩码/参考帧就能精准移除/添加对象

纯文本驱动视频编辑，清华&华为&中科大实现无需掩码/参考帧就能精准移除/添加对象

近年来，基于扩散的视频生成模型的最新进展极大地提高了视频编辑的真实感和可控性。然而，文字驱动的视频对象移除添加依然面临巨大挑战：

来自主题: AI技术研报

8478 点击 2025-12-12 09:37

上一页当前第114页,共430页下一页