AI技术研报-这里有最前沿的人工智能技术解读

教程|别只盯着 Langchain！Google ADK 搭建 Agent，上下文管理效率翻倍

Agent 的状态数据分两种：会话内的临时上下文和跨会话的长期知识。

来自主题: AI技术研报

8808 点击 2025-12-26 09:43

《全载录丨Xsignal 全球AI应用行业年度报告丨2025》丨Xsignal深度文章

在生成式AI（GenAI）的推动下，2025年标志着行业从“震撼期”正式步入“深水区”。这并非资本的泡沫，而是计算范式从CPU向GPU的根本性迁移——数据中心正进化为实时生产智能的“AI工厂”。相比于模型参数的单纯竞赛，AI应用带来的“任务执行”能力与直观体验，让人切身感受到从“信息检索”向“智能生成”的范式跃迁。

来自主题: AI技术研报

11174 点击 2025-12-26 09:43

向量检索爆雷！傅聪联合浙大发布IceBerg Benchmark：HNSW并非最优，评估体系存在严重偏差

将多模态数据纳入到RAG，甚至Agent框架，是目前LLM应用领域最火热的主题之一，针对多模态数据最自然的召回方式，便是向量检索。

来自主题: AI技术研报

7617 点击 2025-12-26 09:40

超越谷歌，全球第一！上交AI科学家王者归来，登顶OpenAI MLE-bench

刚刚，由SciMaster团队推出的AI机器学习专家ML-Master 2.0，基于国产开源大模型DeepSeek，在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流，刷新全球SOTA，再次登顶！目前该功能已在SciMaster线上平台开放waiting list，欢迎申请体验。

来自主题: AI技术研报

7754 点击 2025-12-25 14:22

游戏AI来了！英伟达新模型看直播学会所有游戏，GPT-5.2秒杀塞尔达

英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国，看4万小时直播学会几乎所有游戏！

来自主题: AI技术研报

7649 点击 2025-12-25 14:17

GPT-5被吐槽没进步？Epoch年终报告打脸：AI在飞速狂飙，ASI更近了！

Epoch AI年终大盘点来了！出乎意料的是，AI没有停滞，反而变快了。

来自主题: AI技术研报

8215 点击 2025-12-25 10:49

Anthropic公布新技术：不靠删数据，参数隔离移除AI危险

近年来，大语言模型的能力突飞猛进，但随之而来的却是愈发棘手的双重用途风险（dual-use risks）。当模型在海量公开互联网数据中学习时，它不仅掌握语言与推理能力，也不可避免地接触到 CBRN（化学、生物、放射、核）危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。

来自主题: AI技术研报

9594 点击 2025-12-25 10:21

硅谷青睐的中国模型更新了！一觉醒来，直接套壳

智谱作为「大模型第一股」赴港上市前夕，直接掏出了旗舰模型GLM-4.7并开源！

来自主题: AI技术研报

7200 点击 2025-12-25 10:21

阿里最强“PS模型”开源！一手体验，0元P出氛围感合影

热门LoRA首次内置，控光换镜头实测可用。

来自主题: AI技术研报

9829 点击 2025-12-25 10:17

生成不遗忘，「超长时序」世界模型！北大EgoLCD长短时记忆加持

视频生成模型总是「记性不好」？生成几秒钟后物体就变形、背景就穿帮？北大、中大等机构联合发布EgoLCD，借鉴人类「长短时记忆」机制，首创稀疏KV缓存+LoRA动态适应架构，彻底解决长视频「内容漂移」难题，在EgoVid-5M基准上刷新SOTA！让AI像人一样拥有连贯的第一人称视角记忆。

来自主题: AI技术研报

8492 点击 2025-12-25 10:16

北航提出代码大模型的 Scaling Laws：编程语言差异与多语言最优配比策略

在代码大模型（Code LLMs）的预训练中，行业内长期存在一种惯性思维，即把所有编程语言的代码都视为同质化的文本数据，主要关注数据总量的堆叠。然而，现代软件开发本质上是多语言混合的，不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报

7941 点击 2025-12-25 09:46

最鲁棒的MLLM！港科大开源「退化感知推理新范式」 | AAAI'26

多模态大语言模型（MLLMs）已成为AI视觉理解的核心引擎，但其在真实世界视觉退化（模糊、噪声、遮挡等）下的性能崩溃，始终是制约产业落地的致命瓶颈。

来自主题: AI技术研报

9335 点击 2025-12-25 09:44

攻克长视频生成记忆难题：港大与快手可灵MemFlow设计动态自适应长期记忆，告别快速遗忘与剧情错乱

你是否曾被AI视频生成的不连贯性所困扰？

来自主题: AI技术研报

8346 点击 2025-12-25 09:41

从「会表演」到「更会演」：KlingAvatar2.0让数字人拥有生动灵魂

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗？现在，它迎来了史诗级进化！

来自主题: AI技术研报

9658 点击 2025-12-24 15:32

告别关键词高亮，语义高亮才是解决搜索 / Agent噪音的标准答案

今天聊一聊怎么在RAG、agent场景中实现语义高亮（Semantic Highlight）。

来自主题: AI技术研报

10533 点击 2025-12-24 15:31

拒绝「盲修」：JarvisEvo 如何让 Agent 像人类一样拥有「视觉反思」能力？

在迈向通用人工智能的道路上，我们一直在思考一个问题：现有的 Image Editing Agent，真的「懂」修图吗？

来自主题: AI技术研报

7129 点击 2025-12-24 15:01

GLM-4.7发布后，n8n就不用学了！搭个AI Skills一键生成工作流

今天，我又要来得罪人了。甚至可以说，这篇文章发出来，可能会直接断了很多人的财路。

来自主题: AI技术研报

10903 点击 2025-12-24 10:42

拿走200多万奖金的AI人才，到底给出了什么样的技术方案？

在国内，懂技术 —— 尤其是 AI 技术的年轻人，真的不缺崭露头角的机会。

来自主题: AI技术研报

7608 点击 2025-12-24 10:09

清华系DeepSeek时刻来了，硅谷沸腾！单卡200倍加速，视频进入秒级时代

视频生成领域的「DeepSeek时刻」来了！清华开源TurboDiffusion，将AI视频生成从「分钟级」硬生生拉进「秒级」实时时代，单卡200倍加速让普通显卡也能跑出大片！

来自主题: AI技术研报

9075 点击 2025-12-24 10:08

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

为什么大模型厂商给了 128K 的上下文窗口，却在计费上让长文本显著更贵？

来自主题: AI技术研报

8355 点击 2025-12-24 10:07

单卡训练1亿高斯点，重建25平方公里城市：3DGS内存墙被CPU「外挂」打破了

想用3D高斯泼溅（3DGS）重建一座城市？

来自主题: AI技术研报

7196 点击 2025-12-24 10:05

谷歌黑魔法，没人能看懂的Gemini 3 Flash

参数越小，智商越高？Gemini 3 Flash用百万级长上下文、白菜价成本，把自家大哥Pro按在地上摩擦。谷歌到底掏出了什么黑魔法，让整个大模型圈开始怀疑人生？

来自主题: AI技术研报

9326 点击 2025-12-23 15:22

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境：专家模型精度高但依赖 Mask，通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF，受 LLM「思维链」启发，通过「看 - 推理 - 编辑」的流程，仅需 50k 训练数据，就在多项任务上取得了 SOTA 效果，并完美支持长视频外推！

来自主题: AI技术研报

8817 点击 2025-12-23 14:53