AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

一直以来,关于人工生命(Artificial Life, ALife)的研究致力于回答这样一个问题:生命的复杂性能否在计算系统中自然涌现?

来自主题: AI技术研报
6669 点击    2025-11-05 17:22
全球首个「导航大脑」上线!一句话让机器人自己找路回家

全球首个「导航大脑」上线!一句话让机器人自己找路回家

全球首个「导航大脑」上线!一句话让机器人自己找路回家

银河通用联合多所大学发布了全球首个跨本体全域环视导航基座大模型NavFoM,让机器人能自己找路,而不再依赖遥控,从而推动具身智能向规模化商业落地演进。

来自主题: AI技术研报
5691 点击    2025-11-05 17:20
具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

当前机器人领域,基础模型主要基于「视觉-语言预训练」,这样可将现有大型多模态模型的语义泛化优势迁移过来。但是,机器人的智能确实能随着算力和数据的增加而持续提升吗?我们能预测这种提升吗?

来自主题: AI技术研报
5723 点击    2025-11-05 16:42
清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

近期,Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5,其核心亮点之一便是被称为 Motion Transfer Mechanism(MT)的端到端动作迁移算法 —— 无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。

来自主题: AI技术研报
7557 点击    2025-11-05 16:39
用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

扩散大语言模型得到了突飞猛进的发展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型,同期人民大学发布第一个开源 8B 扩散大语言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。

来自主题: AI技术研报
8678 点击    2025-11-05 15:17
AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

11 月 2 日,英伟达首次把 H100 GPU 送入了太空,参阅报道《英伟达发射了首个太空 AI 服务器,H100 已上天》。而刚刚谷歌宣布,他们也要让 TPU 上天。

来自主题: AI技术研报
6964 点击    2025-11-05 15:15
震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

2025 年 10 月,美股经历了一轮典型的震荡行情:月初科技股强势反弹,月中通胀数据扰动市场,10 月 10 日前后纳指单日波动超过 3%。就在这波谲云诡的市场环境中,港大黄超教授团队的开源 AI-Trader 项目正式启动实盘测试。该项目上线一周时间在 GitHub 上获得了近 8K 星标,展现了社区对 AI 自主交易技术和金融市场分析的能力高度关注。

来自主题: AI技术研报
5853 点击    2025-11-05 10:28
让AI生成视频「又长又快」:Rolling Forcing实现分钟级实时生成

让AI生成视频「又长又快」:Rolling Forcing实现分钟级实时生成

让AI生成视频「又长又快」:Rolling Forcing实现分钟级实时生成

想象一下,你正在玩一款开放世界游戏,角色在无缝衔接的世界中自由漫游,游戏引擎必须实时生成一条无限长的视频流来呈现这个虚拟世界。或者,你戴着 AR 眼镜在街头行走,系统需要根据你的视线与动作,即时生成与你环境交互的画面。无论是哪种场景,都对 AI 提出了同样的要求:能实时生成高质量、长时间连贯的视频流。

来自主题: AI技术研报
5947 点击    2025-11-05 09:58
Context Engineering 2.0:在未来,一个人的本质,就是其所有上下文的总和|上海交大

Context Engineering 2.0:在未来,一个人的本质,就是其所有上下文的总和|上海交大

Context Engineering 2.0:在未来,一个人的本质,就是其所有上下文的总和|上海交大

在几天前,上海交大发布了一篇名为 《上下文工程2.0:上下文工程的上下文》(Context Engineering 2.0: The Context of Context Engineering) 的重磅论文。

来自主题: AI技术研报
5418 点击    2025-11-05 09:57
多模态大模型理解物理工具吗?PhysToolBench提出了衡量多模态大模型对物理工具理解的基准

多模态大模型理解物理工具吗?PhysToolBench提出了衡量多模态大模型对物理工具理解的基准

多模态大模型理解物理工具吗?PhysToolBench提出了衡量多模态大模型对物理工具理解的基准

人类之所以能与复杂的物理世界高效互动,很大程度上源于对「工具」的使用、理解与创造能力。对任何通用型智能体而言,这同样是不可或缺的基本技能,对物理工具的使用会大大影响任务的成功率与效率。

来自主题: AI技术研报
10014 点击    2025-11-05 09:57
Embedding相似度不是万金油,电商、 新闻场景如何按时效性做rerank

Embedding相似度不是万金油,电商、 新闻场景如何按时效性做rerank

Embedding相似度不是万金油,电商、 新闻场景如何按时效性做rerank

同样是语义相似度结合时效性做rerank,指数衰减、高斯衰减、线性衰减怎么选? 假设你要在一个新闻应用中落地语义检索功能,让用户搜索雷军的投资版图盘点时,能自动关联顺为资本、小米战投等核心关联信息。

来自主题: AI技术研报
8197 点击    2025-11-05 09:46
Prompt-R1:让Agent代替你和GPT多轮交互!

Prompt-R1:让Agent代替你和GPT多轮交互!

Prompt-R1:让Agent代替你和GPT多轮交互!

这篇论文提出了一种颠覆性的协作模式,即通过强化学习训练一个“小模型”作为智能代理(Agent),让它自动学会如何写出完美的Prompt,一步步引导任何一个“大模型”完成复杂推理,实现了真正的“AI指挥AI”。

来自主题: AI技术研报
7334 点击    2025-11-04 16:54
HF日趋榜一!真端到端模型AutoDeco终结手动调参解码

HF日趋榜一!真端到端模型AutoDeco终结手动调参解码

HF日趋榜一!真端到端模型AutoDeco终结手动调参解码

大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。

来自主题: AI技术研报
10055 点击    2025-11-04 16:14
字节Seed团队发布循环语言模型Ouro,在预训练阶段直接「思考」,Bengio组参与

字节Seed团队发布循环语言模型Ouro,在预训练阶段直接「思考」,Bengio组参与

字节Seed团队发布循环语言模型Ouro,在预训练阶段直接「思考」,Bengio组参与

现代 LLM 通常依赖显式的文本生成过程(例如「思维链」)来进行「思考」训练。这种策略将推理任务推迟到训练后的阶段,未能充分挖掘预训练数据中的潜力。

来自主题: AI技术研报
8257 点击    2025-11-04 16:12
英伟达帮你省钱,让大模型推理「短而精」,速度快5倍

英伟达帮你省钱,让大模型推理「短而精」,速度快5倍

英伟达帮你省钱,让大模型推理「短而精」,速度快5倍

大模型推理到底要不要「长篇大论」?过去一年,OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型,把「长链思维」玩到极致:答案更准了,但代价是推理链越来越长、Token 消耗爆炸、响应速度骤降。

来自主题: AI技术研报
6012 点击    2025-11-04 16:09
ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics,基于分形水印的主动深度伪造检测与定位

ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics,基于分形水印的主动深度伪造检测与定位

ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics,基于分形水印的主动深度伪造检测与定位

该论文提出 FractalForensics,一种基于分形水印的主动深度伪造检测与定位方法。不同于以往的水印向量,为达成伪造定位的功能,论文提出的水印以矩阵形式出现。

来自主题: AI技术研报
7384 点击    2025-11-04 14:44
全网AI看不到的爱心,被这款开源全模态模型攻克了。。

全网AI看不到的爱心,被这款开源全模态模型攻克了。。

全网AI看不到的爱心,被这款开源全模态模型攻克了。。

昨天一大早,就发现美团开源了他们首款全模态实时交互大模型:LongCat-Flash-Omni。

来自主题: AI技术研报
9120 点击    2025-11-04 11:57
NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。

来自主题: AI技术研报
5540 点击    2025-11-04 11:33
最具争议性研究:大模型中间层输出可 100% 反推原始输入

最具争议性研究:大模型中间层输出可 100% 反推原始输入

最具争议性研究:大模型中间层输出可 100% 反推原始输入

Transformer 语言模型具有单射性,隐藏状态可无损重构输入信息。

来自主题: AI技术研报
8336 点击    2025-11-04 11:32
让LLM不再话痨,快手HiPO框架来了

让LLM不再话痨,快手HiPO框架来了

让LLM不再话痨,快手HiPO框架来了

当用户向大语言模型提出一个简单问题,比如「单词 HiPPO 里有几个字母 P?」,它却正襟危坐,开始生成一段冗长的推理链:

来自主题: AI技术研报
8029 点击    2025-11-04 10:44
斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

传统智能体系统难以兼顾稳定性和学习能力,斯坦福等学者提出AgentFlow框架,通过模块化和实时强化学习,在推理中持续优化策略,并使小规模模型在多项任务中超越GPT-4o,为AI发展开辟新思路。

来自主题: AI技术研报
7321 点击    2025-11-04 10:43
抖音SAIL团队联合港中文MMLab推出SAIL-Embedding:打通「视、文、音」的全模态嵌入

抖音SAIL团队联合港中文MMLab推出SAIL-Embedding:打通「视、文、音」的全模态嵌入

抖音SAIL团队联合港中文MMLab推出SAIL-Embedding:打通「视、文、音」的全模态嵌入

在短视频推荐、跨模态搜索等工业场景中,传统多模态模型常受限于模态支持单一、训练不稳定、领域适配性差等问题。

来自主题: AI技术研报
8253 点击    2025-11-04 10:42
AI越会思考,越容易被骗?「思维链劫持」攻击成功率超过90%

AI越会思考,越容易被骗?「思维链劫持」攻击成功率超过90%

AI越会思考,越容易被骗?「思维链劫持」攻击成功率超过90%

独立研究者 Jianli Zhao 等人近日的一项新研究发现,通过在有害请求前填充一长串无害的解谜推理序列(harmless puzzle reasoning),就能成功对推理模型实现越狱攻击。他们将这种方法命名为思维链劫持(Chain-of-Thought Hijacking)。

来自主题: AI技术研报
8514 点击    2025-11-04 10:27
达摩院推出多智能体框架ReasonMed,打造医学推理数据生成新范式

达摩院推出多智能体框架ReasonMed,打造医学推理数据生成新范式

达摩院推出多智能体框架ReasonMed,打造医学推理数据生成新范式

在人工智能领域,推理语言模型(RLM)虽然在数学与编程任务中已展现出色性能,但在像医学这样高度依赖专业知识的场景中,一个亟待回答的问题是:复杂的多步推理会帮助模型提升医学问答能力吗?要回答这个问题,需要构建足够高质量的医学推理数据,当前医学推理数据的构建存在以下挑战:

来自主题: AI技术研报
8809 点击    2025-11-03 14:50
美团新独立APP,点不了菜只能点AI

美团新独立APP,点不了菜只能点AI

美团新独立APP,点不了菜只能点AI

用外卖的打法做AI模型?美团这是跟“又快又稳”杠上了(doge)。

来自主题: AI技术研报
5172 点击    2025-11-03 14:49