AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
NeurIPS 2025 | 告别全量扫描!浙大提出COIDO:破解多模态数据选择「高耗」难题

NeurIPS 2025 | 告别全量扫描!浙大提出COIDO:破解多模态数据选择「高耗」难题

NeurIPS 2025 | 告别全量扫描!浙大提出COIDO:破解多模态数据选择「高耗」难题

在深入技术细节之前,我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案:正如钟离在漫画中所言,面对海量视觉指令数据的选择任务,传统方法需要遍历全部数据才能进行筛选造成大量「磨损」(高昂计算成本)。同时在面对数据重要性和多样性问题时,传统方法往往顾此失彼。

来自主题: AI技术研报
6511 点击    2025-12-14 10:46
港大开源ViMax火了,实现AI自编自导自演

港大开源ViMax火了,实现AI自编自导自演

港大开源ViMax火了,实现AI自编自导自演

想象一下,只需要一句话描述,AI 就能为你拍出一部完整的短剧?为了让这个想法变成现实,香港大学黄超教授团队开源了 ViMax 框架,并在 GitHub 获得 1.4k + 星标,专注于 Agentic Video Generation 的前沿探索。通过多智能体协作,ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化,把传统影视制作的每个环节都搬进了 AI 世界。

来自主题: AI技术研报
8094 点击    2025-12-13 11:06
告别「盲目自信」,CCD:扩散语言模型推理新SOTA

告别「盲目自信」,CCD:扩散语言模型推理新SOTA

告别「盲目自信」,CCD:扩散语言模型推理新SOTA

扩散语言模型(Diffusion Language Models)以其独特的 “全局规划” 与并行解码能力广为人知,成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下,其通常面临

来自主题: AI技术研报
6881 点击    2025-12-13 10:59
效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。

来自主题: AI技术研报
8556 点击    2025-12-12 09:38
你的Agent可能设计错了:UIUC & 斯坦福等联合发文,重构Agent适配2X2

你的Agent可能设计错了:UIUC & 斯坦福等联合发文,重构Agent适配2X2

你的Agent可能设计错了:UIUC & 斯坦福等联合发文,重构Agent适配2X2

随着基础模型的日益成熟,AI领域的研发重心正从“训练更强的模型”转移到“构建更强的系统”。在这个新阶段,适配(Adaptation) 成为了连接通用智能与垂直应用的关键纽带。

来自主题: AI技术研报
8162 点击    2025-12-12 08:53
谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招:Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交互API(Interactions API)。

来自主题: AI资讯
8748 点击    2025-12-12 08:14
Khosla 继 OpenAI 后的最大赌注,General Intuition 凭 38 亿个游戏高光片段做世界模型

Khosla 继 OpenAI 后的最大赌注,General Intuition 凭 38 亿个游戏高光片段做世界模型

Khosla 继 OpenAI 后的最大赌注,General Intuition 凭 38 亿个游戏高光片段做世界模型

今年 10 月,专注构建世界模型的 General Intuition 完成了高达 1.34 亿美元的种子轮融资。这笔融资由硅谷传奇投资人 Vinod Khosla 领投,这是他自 2019 年首次投资 OpenAI 以来开出的最大单笔种子轮投资,也标志着他在 LLM 之后对下一代智能范式做出的一次重大下注。

来自主题: AI资讯
8775 点击    2025-12-11 10:59
Agentic AI基金会成立,智能体的“Linux时刻”来了!MCP、AGENTS.md集体上车,下一代AI技术栈PARK出世

Agentic AI基金会成立,智能体的“Linux时刻”来了!MCP、AGENTS.md集体上车,下一代AI技术栈PARK出世

Agentic AI基金会成立,智能体的“Linux时刻”来了!MCP、AGENTS.md集体上车,下一代AI技术栈PARK出世

刚刚,Linux 基金会正式宣布推出智能体 AI 基金会(Agentic AI Foundation,简称 AAIF)。据公告披露,AAIF 定位为 AI 智能体(AI agents)相关开源项目的中立托管平台,全球几乎所有科技巨头均已签约成为该基金会成员。Anthropic、OpenAI 与 Block 三家公司作为联合创始成员,将贡献三大开源项目,构成基金会启动初期的支柱。

来自主题: AI资讯
8155 点击    2025-12-11 09:58
Percept-WAM:真正「看懂世界」的自动驾驶大脑,感知到行动的一体化模型

Percept-WAM:真正「看懂世界」的自动驾驶大脑,感知到行动的一体化模型

Percept-WAM:真正「看懂世界」的自动驾驶大脑,感知到行动的一体化模型

近日,来自引望智能与复旦大学的研究团队联合提出了一个面向自动驾驶的新一代大模型 ——Percept-WAM(Perception-Enhanced World–Awareness–Action Model)。该模型旨在在一个统一的大模型中,将「看见世界(Perception)」「理解世界(World–Awareness)」和「驱动车辆行动(Action)」真正打通,形成一条从感知到决策的完整链路。

来自主题: AI技术研报
6117 点击    2025-12-10 14:33
深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

12月8日,Airwallex空中云汇继今年5月后再次宣布获得新一轮3.3亿美元G轮融资,投后估值达 80 亿美元,较六个月前 F 轮融资时上涨近 30%。本次融资由Addition领投,T. Rowe Price、Activant、Lingotto、Robinhood Ventures和 TIAA Ventures等全球顶级资本参与投资。

来自主题: AI资讯
9703 点击    2025-12-09 11:50