AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

这几天,相信大家肯定都被一个产品名给刷屏了。

来自主题: AI技术研报
9883 点击    2026-01-28 15:29
AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术,其目标是仅通过单幅图像预测出场景的密集几何结构与语义标签。

来自主题: AI技术研报
8634 点击    2026-01-28 14:58
比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?

来自主题: AI技术研报
9530 点击    2026-01-28 14:55
曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

在 AI 浪潮席卷全球的今天,大模型在写诗、作画、敲代码上已经展现出惊人的天赋。然而,在面对严谨、硬核的物质科学(物理、化学、材料)时,却常常表现得像个“偏科生”:它们能侃侃而谈化学理论,却在最基础的分子式、晶体结构书写和反应推理上频繁出现不稳定输出:说的像那么回事,写出来却漏洞百出。

来自主题: AI技术研报
5767 点击    2026-01-28 14:54
Claude Code 浏览器自动化方案,怎么选?

Claude Code 浏览器自动化方案,怎么选?

Claude Code 浏览器自动化方案,怎么选?

哈喽,大家好,我是刘小排。 昨天和几位创业的朋友吃饭,席间讨论了一个问题:“在Claude Code中,最好的浏览器自动化方案是什么?”

来自主题: AI技术研报
9655 点击    2026-01-28 11:32
You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

我们都在System Prompt里写过无数次 You are a helpful assistant,但你是否想过:这行文字在模型的残差流(Residual Stream)中究竟对应着怎样的几何结构?

来自主题: AI技术研报
6232 点击    2026-01-28 10:15
大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。

来自主题: AI技术研报
9781 点击    2026-01-28 10:13
持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

持续怒斩53K星!狠人揭秘Clawdbot反行业记忆系统!跟ChatGPT大不同:不靠狂塞上下文,而是一个个md文件!网友:AI记忆第一次被工程化了

过去一年,几乎所有 AI 产品都在谈一个词:记忆。

来自主题: AI技术研报
6014 点击    2026-01-27 16:52
DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。

来自主题: AI技术研报
5497 点击    2026-01-27 16:51
机器人看不清,蚂蚁给治好了

机器人看不清,蚂蚁给治好了

机器人看不清,蚂蚁给治好了

天下苦机器人看不清透明和反光物体久矣。

来自主题: AI技术研报
7137 点击    2026-01-27 16:19
高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透

随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。

来自主题: AI技术研报
7196 点击    2026-01-27 16:19
思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。

来自主题: AI技术研报
6768 点击    2026-01-27 16:17
让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩,那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢?有研究团队做出了探索性尝试。

来自主题: AI技术研报
5394 点击    2026-01-27 09:40
北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

近日,北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据,发现语言其实是一副无形的智能眼镜,时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么,但是这项成果说明了视觉从来都不是孤立的。事实上,当我们在看图片的时候,其实不只是在看,而是在进行被语言调制过的看。

来自主题: AI技术研报
7571 点击    2026-01-27 09:27
DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指令微调模型的差距。直观来看,它们似乎只是思考得更久了:更长的 Chain-of-Thought、更高的 test-time compute,成为最常被引用的解释。

来自主题: AI技术研报
5805 点击    2026-01-26 15:02
再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

再见,人类程序员!OpenAI自曝:一行代码都不写了,100%用Codex

100%是用Codex写的。还有内部爆料说,Codex让他们仅用三天时间就搭出了服务器,三周就发布了APP。人类程序员,真的要退出历史舞台了?

来自主题: AI技术研报
9202 点击    2026-01-26 15:02
这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

这套X+Claude Skill+Obsidian工作流,干掉了我90%的选题焦虑

我一直有一个习惯,就每天都会刷 Twitter。倒也不是为了打发时间,而是因为在 AI 这个领域,Twitter 几乎是最前沿的信息源。新论文、新产品、行业八卦、技术突破,很多时候,等中文媒体跟进报道,已经是三五天后的事了。

来自主题: AI技术研报
6896 点击    2026-01-26 14:59
斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福×英伟达发布AI推理新范式,刷新了多领域SOTA

斯坦福与英伟达联合发布重磅论文 TTT-Discover,打破「模型训练完即定型」的铁律。它让 AI 在推理阶段针对特定难题「现场长脑子」,不惜花费数百美元算力,只为求得一次打破纪录的极值。从重写数学猜想到碾压人类代码速度,这种「激进进化」正在重新定义机器发现的边界。

来自主题: AI技术研报
6904 点击    2026-01-26 14:23
关于多模态大模型Token压缩技术进展,看这一篇就够了

关于多模态大模型Token压缩技术进展,看这一篇就够了

关于多模态大模型Token压缩技术进展,看这一篇就够了

近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ,带来极高的显存占用和延迟,限制了模型的可扩展性和本地部署。

来自主题: AI技术研报
8790 点击    2026-01-26 14:22
AI圈开年王炸:Agent Skill 正式登场

AI圈开年王炸:Agent Skill 正式登场

AI圈开年王炸:Agent Skill 正式登场

2026 年才开始,全球 AI 行业就迎来了第一个开年王炸。不是来自某个更大的模型参数,不是某家实验室刷新了榜单分数,而是一个看似不起眼、却迅速破圈的概念——Agent Skill。

来自主题: AI技术研报
6173 点击    2026-01-26 14:21
AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

AAAI 2026杰出论文奖 | ReconVLA:具身智能研究首次获得AI顶级会议最佳论文奖

在长期以来的 AI 研究版图中,具身智能虽然在机器人操作、自动化系统与现实应用中至关重要,却常被视为「系统工程驱动」的研究方向,鲜少被认为能够在 AI 核心建模范式上产生决定性影响。

来自主题: AI技术研报
6531 点击    2026-01-26 14:21
还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~

大家好,我是最近天天折腾CLI Agent的袋鼠帝。 一周前,我给大家安利了一款Claude Code的最强开源对手:OpenCode,没想到文章发出去后反响这么热烈,不管是阅读量还是评论都非常多。刚好,前几天我看到腾讯的CodeBuddy Code重磅升级到了2.0版本。说实话,CodeBuddy Code我有用过,基本完全复刻Claude Code,之前还帮我开发了好几个小工具,很实用。

来自主题: AI技术研报
8032 点击    2026-01-26 11:31