AI技术研报-这里有最前沿的人工智能技术解读

从「会表演」到「更会演」：KlingAvatar2.0让数字人拥有生动灵魂

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗？现在，它迎来了史诗级进化！

来自主题: AI技术研报

8415 点击 2025-12-24 15:32

告别关键词高亮，语义高亮才是解决搜索 / Agent噪音的标准答案

今天聊一聊怎么在RAG、agent场景中实现语义高亮（Semantic Highlight）。

来自主题: AI技术研报

9066 点击 2025-12-24 15:31

拒绝「盲修」：JarvisEvo 如何让 Agent 像人类一样拥有「视觉反思」能力？

在迈向通用人工智能的道路上，我们一直在思考一个问题：现有的 Image Editing Agent，真的「懂」修图吗？

来自主题: AI技术研报

5939 点击 2025-12-24 15:01

GLM-4.7发布后，n8n就不用学了！搭个AI Skills一键生成工作流

今天，我又要来得罪人了。甚至可以说，这篇文章发出来，可能会直接断了很多人的财路。

来自主题: AI技术研报

9301 点击 2025-12-24 10:42

拿走200多万奖金的AI人才，到底给出了什么样的技术方案？

在国内，懂技术 —— 尤其是 AI 技术的年轻人，真的不缺崭露头角的机会。

来自主题: AI技术研报

6354 点击 2025-12-24 10:09

清华系DeepSeek时刻来了，硅谷沸腾！单卡200倍加速，视频进入秒级时代

视频生成领域的「DeepSeek时刻」来了！清华开源TurboDiffusion，将AI视频生成从「分钟级」硬生生拉进「秒级」实时时代，单卡200倍加速让普通显卡也能跑出大片！

来自主题: AI技术研报

7851 点击 2025-12-24 10:08

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

为什么大模型厂商给了 128K 的上下文窗口，却在计费上让长文本显著更贵？

来自主题: AI技术研报

6808 点击 2025-12-24 10:07

单卡训练1亿高斯点，重建25平方公里城市：3DGS内存墙被CPU「外挂」打破了

想用3D高斯泼溅（3DGS）重建一座城市？

来自主题: AI技术研报

5857 点击 2025-12-24 10:05

谷歌黑魔法，没人能看懂的Gemini 3 Flash

参数越小，智商越高？Gemini 3 Flash用百万级长上下文、白菜价成本，把自家大哥Pro按在地上摩擦。谷歌到底掏出了什么黑魔法，让整个大模型圈开始怀疑人生？

来自主题: AI技术研报

8073 点击 2025-12-23 15:22

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境：专家模型精度高但依赖 Mask，通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF，受 LLM「思维链」启发，通过「看 - 推理 - 编辑」的流程，仅需 50k 训练数据，就在多项任务上取得了 SOTA 效果，并完美支持长视频外推！

来自主题: AI技术研报

7620 点击 2025-12-23 14:53

智能体落地元年，Agent Infra是关键一环｜对话腾讯云&Dify

毋庸置疑！2025年title属于「Agent元年」。

来自主题: AI技术研报

9131 点击 2025-12-23 14:52

AI一旦开始「内卷」，会变成什么样？腾讯混元和上交联合揭秘多智能体「饥饿游戏」

在多智能体系统的想象中，我们常常看到这样一幅图景：多个 AI 智能体分工协作、彼此配合，像一个高效团队一样攻克复杂任务，展现出超越单体智能的 “集体智慧”。

来自主题: AI技术研报

9667 点击 2025-12-23 14:33

为什么Agent总是Demo猛如龙实战一条虫？

为什么Agent在演示时无所不能，到了实际场景却频频拉胯？

来自主题: AI技术研报

8801 点击 2025-12-23 14:32

全网首测！首款国产GPU「AI算力本」现场上手

除了英特尔和AMD，现在我们终于可以选择国产笔记本电脑显卡了！这款显卡的背后，饱含着中国工程师们日夜攻坚的汗水与泪水。

来自主题: AI技术研报

9717 点击 2025-12-23 10:35

ImageNet分数越高，生成反而越糊？iREPA给出解释

学霸的谎言被揭穿！一篇来自Adobe Research的论文发现，高语义理解并不会提升生成质量，反而可能破坏空间结构。用iREPA简单修改，削弱全局干扰，生成质量立即飙升。

来自主题: AI技术研报

8782 点击 2025-12-23 10:05

最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品

在过去两年里，记忆（Memory）几乎从 “可选模块” 迅速变成了 Agent 系统的 “基础设施”：对话型助手需要记住用户习惯与历史偏好；代码 / 软件工程 Agent 需要记住仓库结构、约束与修复策略；

来自主题: AI技术研报

8160 点击 2025-12-23 09:28

复杂空间推理新SOTA，性能提升55%！中山大学新作SpatialDreamer

中山大学等机构推出SpatialDreamer，通过主动心理想象和空间推理，显著提升了复杂空间任务的性能。模拟人类主动探索、想象和推理的过程，解决了现有模型在视角变换等任务中的局限，为人工智能的空间智能发展开辟了新路径。

来自主题: AI技术研报

9967 点击 2025-12-23 09:27

RL加持的3D生成时代来了！首个「R1 式」文本到3D推理大模型AR3D-R1登场

强化学习（RL）在大语言模型和 2D 图像生成中大获成功后，首次被系统性拓展到文本到 3D 生成领域！面对 3D 物体更高的空间复杂性、全局几何一致性和局部纹理精细化的双重挑战，研究者们首次系统研究了 RL 在 3D 自回归生成中的应用！

来自主题: AI技术研报

7873 点击 2025-12-23 09:27

OpenAI这招太狠！AI从「躲猫猫」到「自爆黑料」，主打一个坦白

随着AI越来越强大并进入更高风险场景，透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」，让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。

来自主题: AI技术研报

6701 点击 2025-12-23 09:26

MiniMax海螺视频团队首次开源：Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队不藏了！首次开源就揭晓了一个困扰行业已久的问题的答案——为什么往第一阶段的视觉分词器里砸再多算力，也无法提升第二阶段的生成效果？翻译成大白话就是，虽然图像/视频生成模型的参数越做越大、算力越堆越猛，但用户实际体验下来总有一种微妙的感受——这些庞大的投入与产出似乎不成正比，模型离完全真正可用总是差一段距离。

来自主题: AI技术研报

7349 点击 2025-12-22 17:07

100万亿Token揭示真相：中国开源AI拿下30%全球份额，推理已成主流

之前我在这篇文章(超全面免费 AI API 分享！零成本开启你的AI之旅！)中介绍过 OpenRouter 这个大模型 API 聚合平台，最近他们通过分析了100 万亿 token用户真实数据，发布了一篇研究报告，反应了真实用户的大模型使用现状。100 万亿 token 是什么概念呢？是人类所有文字资料的好几倍，这个数据量非常有说服力。

来自主题: AI技术研报

5739 点击 2025-12-22 17:05