AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

这是一篇报告解读,原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》

来自主题: AI技术研报
6503 点击    2025-12-02 10:46
AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

随着大语言模型(LLM)的商业价值快速提升,其昂贵的训练成本使得模型版权保护(IP Protection)成为业界关注的焦点。然而,现有模型版权验证手段(如模型指纹)往往忽略一个关键威胁:攻击者一旦直接窃取模型权重,即拥有对模型的完全控制权,能够逆向指纹 / 水印,或通过修改输出内容绕过指纹验证。

来自主题: AI技术研报
7746 点击    2025-12-02 10:20
88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week

本文为Milvus Week系列第一篇,该系列旨在分享Zilliz、Milvus在系统性能、索引算法和云原生架构上的创新与实践,以下是DAY1内容划重点:

来自主题: AI技术研报
6477 点击    2025-12-02 10:17
英伟达拿出推理版VLA:Alpamayo-R1让自动驾驶AI更会动脑子

英伟达拿出推理版VLA:Alpamayo-R1让自动驾驶AI更会动脑子

英伟达拿出推理版VLA:Alpamayo-R1让自动驾驶AI更会动脑子

当今自动驾驶模型越来越强大,摄像头、雷达、Transformer 网络一齐上阵,似乎什么都「看得见」。但真正的挑战在于:模型能否像人一样「想明白」为什么要这么开?

来自主题: AI技术研报
7312 点击    2025-12-02 09:19
Claude Agent Skills第一性原理深度解析

Claude Agent Skills第一性原理深度解析

Claude Agent Skills第一性原理深度解析

最近看到一篇关于Claude Skills的质量非常高的文章, 标题:Claude Agent Skills: A First Principles Deep Dive 链接:https://leehanchung.github.io/blogs/2025/10/26/claude-skills-deep-dive/

来自主题: AI技术研报
8137 点击    2025-12-02 09:05
深入AI Agent内核: Google gemini-cli 源码深度解构

深入AI Agent内核: Google gemini-cli 源码深度解构

深入AI Agent内核: Google gemini-cli 源码深度解构

随着大语言模型与开发工具链的深度融合,命令行终端正被重塑为开发者的AI协作界面。本文以 Google gemini-cli 为范本,通过源码解构,系统性分析其 Agent 内核、ReAct 工作流、工具调用与上下文管理等核心模块的实现原理。为希望构建终端 Agent 的开发者,提供工程实现的系统化参考。

来自主题: AI技术研报
7573 点击    2025-12-01 16:15
6B文生图模型,上线即登顶抱抱脸

6B文生图模型,上线即登顶抱抱脸

6B文生图模型,上线即登顶抱抱脸

6B小模型,首日下载量高达50万次,上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报
6415 点击    2025-12-01 15:13
那些"无聊"的 AI 细分市场,正在批量创造百万富翁

那些"无聊"的 AI 细分市场,正在批量创造百万富翁

那些"无聊"的 AI 细分市场,正在批量创造百万富翁

为什么 AI 让小众市场突然变得值钱了!Ben 提出了一个非常关键的洞察:软件革命催生了 6500 亿美元的软件市场,但 AI 是第一个真正能够自动化劳动力的技术,这意味着我们现在面对的是一个 10 万亿美元的劳动力市场,仅在美国就有这么大的规模。到目前为止,只有 0.2% 的劳动力市场被自动化了。这个数字让我震惊,因为它意味着我们还处在这场革命的最初阶段,99.8% 的机会还在等待被发掘。

来自主题: AI技术研报
7338 点击    2025-12-01 15:10
2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

2025必看系列:AI如何重新定义研究?万字长文讲透Deep Research

如果AI的终极使命是拓展人类认知的边界,那么“研究”——这项系统性探索未知的核心活动,无疑是其最重要的试金石。2024年,AI Agent技术迎来突破性进展,一个名为 Deep Research(深度研究) 的方向正以前所未有的速度站上风口,成为推动“AI应用元年”的真正引擎。

来自主题: AI技术研报
9673 点击    2025-12-01 15:08
如何让Agent具备「情感」当前趋势、挑战与未来|来自298篇研究的最新综述

如何让Agent具备「情感」当前趋势、挑战与未来|来自298篇研究的最新综述

如何让Agent具备「情感」当前趋势、挑战与未来|来自298篇研究的最新综述

在当前的情感计算研究中,存在一个显著的“断层”:我们拥有越来越精准的情感识别算法(输入端),也有了逼真的语音和面部生成技术(输出端),但连接这两端的“中间层”却鲜有人问津。机器能识别出你在愤怒,也能模拟出抱歉的语气,但它真的理解愤怒的起因吗?它能基于这种理解去调整后续的决策逻辑吗?

来自主题: AI技术研报
7353 点击    2025-12-01 14:33
你对ChatGPT越粗鲁,它赚得越多!最新研究揭秘:一条不礼貌提示语会多输出14个token,企业用户每天或多花数十万美元

你对ChatGPT越粗鲁,它赚得越多!最新研究揭秘:一条不礼貌提示语会多输出14个token,企业用户每天或多花数十万美元

你对ChatGPT越粗鲁,它赚得越多!最新研究揭秘:一条不礼貌提示语会多输出14个token,企业用户每天或多花数十万美元

一般人和 ChatGPT 聊天时,往往不会在意要不要讲究礼貌。但来自爱荷华大学的一项最新研究显示:即便回答内容几乎相同,对 ChatGPT 粗鲁无礼也会让你花费更高的输出成本。

来自主题: AI技术研报
6600 点击    2025-12-01 14:29
NeurIPS 2025 | DePass:通过单次前向传播分解实现统一的特征归因

NeurIPS 2025 | DePass:通过单次前向传播分解实现统一的特征归因

NeurIPS 2025 | DePass:通过单次前向传播分解实现统一的特征归因

随着大型语言模型在各类任务中展现出卓越的生成与推理能力,如何将模型输出精确地追溯到其内部计算过程,已成为 AI 可解释性研究的重要方向。然而,现有方法往往计算代价高昂、难以揭示中间层的信息流动;同时,不同层面的归因(如 token、模型组件或表示子空间)通常依赖各自独立的特定方法,缺乏统一且高效的分析框架。

来自主题: AI技术研报
5350 点击    2025-12-01 13:49
你每月烧掉的 Token 费用,至少 20% 都是冤枉钱

你每月烧掉的 Token 费用,至少 20% 都是冤枉钱

你每月烧掉的 Token 费用,至少 20% 都是冤枉钱

Hi,早上好。 我是洛小山,和你聊聊 AI 应用的降本增效。

来自主题: AI技术研报
6961 点击    2025-12-01 11:36
裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

裸眼3D核心难题被攻破,AI加持即能实现无眩晕沉浸体验

我们能否像《头号玩家》那样伸手就能触摸到虚拟世界?像《阿凡达》那样植物和动物仿佛就在眼前飞舞?这不再只是科幻。11 月 26 日,在一篇最新 Nature 论文中,来自复旦大学团队和上海人工智能实验室的研究人员打造出一款名为 EyeReal 的裸眼 3D 显示器。

来自主题: AI技术研报
7898 点击    2025-12-01 10:44
全流程 AI 辅助,我做了一款脑洞大开的微信小游戏!

全流程 AI 辅助,我做了一款脑洞大开的微信小游戏!

全流程 AI 辅助,我做了一款脑洞大开的微信小游戏!

观猹社区里聚集着一群富有创意、动手能力又特别强的创造者。他们来自不同的行业和背景,却在这里形成了某种微妙的共识:认真做产品、诚实写评价、乐于分享想法。

来自主题: AI技术研报
7440 点击    2025-12-01 10:39
NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

导读 过去两年,小语言模型(SLM)在业界备受关注:参数更少、结构更轻,理应在真实部署中 “更快”。但只要真正把它们跑在 GPU 上,结论往往令人意外 —— 小模型其实没有想象中那么快。

来自主题: AI技术研报
7437 点击    2025-12-01 10:09
NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

在大语言模型(LLM)的研究浪潮中,绝大多数工作都聚焦于优化模型的输出分布 —— 扩大模型规模、强化分布学习、优化奖励信号…… 然而,如何将这些输出分布真正转化为高质量的生成结果 —— 即解码(decoding)阶段,却没有得到足够的重视。

来自主题: AI技术研报
5952 点击    2025-12-01 10:06
十倍成本优化,Milvus 2.5到2.6升级官方手把手教程

十倍成本优化,Milvus 2.5到2.6升级官方手把手教程

十倍成本优化,Milvus 2.5到2.6升级官方手把手教程

在架构层面,Milvus 2.6 大幅简化系统架构,整合多个核心组件 —— 例如将原有的 Coordinator 组件(含 RootCoord、QueryCoord、DataCoord)统一整合为 MixCoord,并将 IndexNode 与 DataNode 合并为单一组件。这些调整不仅降低了系统复杂度,更显著提升了系统的可维护性与横向扩展性。

来自主题: AI技术研报
7222 点击    2025-12-01 09:40
AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头

AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头

AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头

近日,腾讯优图实验室联合华东理工大学、北京大学等研究团队在A生成图像检测(AI-Generated Image Detection)泛化问题上展开研究,提出Dual Data Alignment(双重数据对齐,DDA)方法,从数据层面系统性抑制“偏差特征”,显著提升检测器在跨模型、跨数据域场景下的泛化能力。

来自主题: AI技术研报
6210 点击    2025-11-30 15:10
空间智能再进化!Spatial-SSRL帮助LVLM更好读懂空间

空间智能再进化!Spatial-SSRL帮助LVLM更好读懂空间

空间智能再进化!Spatial-SSRL帮助LVLM更好读懂空间

本文第一作者为刘禹宏,上海交通大学人工智能专业本科四年级学生,相关研究工作于上海人工智能实验室科研实习期间完成。通讯作者为王佳琦、臧宇航,在该研究工作完成期间,均担任上海人工智能实验室研究员。

来自主题: AI技术研报
5557 点击    2025-11-30 15:05
2026 年,企业全面拥抱语音 AI 智能体

2026 年,企业全面拥抱语音 AI 智能体

2026 年,企业全面拥抱语音 AI 智能体

a16z 指出:“模型开发的进展正在简化整个基础设施栈,使得语音智能体具备更低延迟和更高性能。这一提升主要出现在过去六个月内,得益于新一代对话模型的出现。”基于这些趋势,Deepgram 与 Opus Research 合作开展的《2025 语音 AI 状况调查报告》,基于 400 位商业领袖的洞察,涵盖十多个行业,分析了语音 AI 的应用现状与关键特性。

来自主题: AI技术研报
8472 点击    2025-11-30 11:52
CB Insights 2025 未来科技新星:45 家高潜力AI初创公司名单与技术趋势解读|Jinqiu Select

CB Insights 2025 未来科技新星:45 家高潜力AI初创公司名单与技术趋势解读|Jinqiu Select

CB Insights 2025 未来科技新星:45 家高潜力AI初创公司名单与技术趋势解读|Jinqiu Select

CB Insights 发布的《2025 Future Tech Hotshots:Scouting Reports》报告,结合生成式 AI 分析与专有 Mosaic 评分体系,从全球海量初创企业中遴选出 45 家最具潜力的科技公司。

来自主题: AI技术研报
8045 点击    2025-11-30 11:43
不炫技的 AI,涨得更快,17 款 AI App接住了人间烟火|2025年10月AI百强榜

不炫技的 AI,涨得更快,17 款 AI App接住了人间烟火|2025年10月AI百强榜

不炫技的 AI,涨得更快,17 款 AI App接住了人间烟火|2025年10月AI百强榜

但当我们把视线从焦点模型上,挪到手机里AI应用真实数据上,就会发现一幅不同的画面。可以看到在非凡产研 10 月 AI App 增速榜上,跑得最快的那 17 个,并不是万事皆可聊的通用助手,而是一群看上去有点普通、甚至有点土气的小应用,其中Gauth、Starry、Knowunity、AI Baby Generator已经连续两个月上榜了。

来自主题: AI技术研报
7227 点击    2025-11-30 11:39
世界模型:机器能否理解现实?

世界模型:机器能否理解现实?

世界模型:机器能否理解现实?

人工智能研究的最新目标,尤其是在追求“通用人工智能”(AGI)的实验室中,是一个被称为“世界模型”(world model)的概念:这是一种AI内部携带的环境表征,就像一个计算型的雪球玻璃球。AI系统可以借助这个简化的内部模型,在真正执行任务之前,先对预测和决策进行评估。

来自主题: AI技术研报
7611 点击    2025-11-30 11:18
NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法:通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗?

来自主题: AI技术研报
7670 点击    2025-11-30 09:30