AI资讯新闻榜单内容搜索-LLM

WAIC五位首席科学家交锋：多模态是LLM的“外挂”，还是下一代智能的“灵魂”？

作为WAIC 2026最受关注的论坛，由商汤科技承办的“基座大模型架构创新与生态合作论坛”吸引了无数AI研究者、产业专家和投资机构的目光。因它直面了当前大模型行业最核心的焦虑：当Scaling Law在逼近物理极限，多模态究竟是破局的“解药”，还是新瓶装旧酒的延伸？

来自主题: AI资讯

8836 点击 2026-07-19 10:11

3步推理生成加速20+倍！CoLT教会多模态大模型用「潜思维链」思考

近年来，多模态大语言模型（MLLM）在视觉问答、图表理解、科学推理等任务上取得了令人瞩目的进展。

来自主题: AI技术研报

6142 点击 2026-07-15 10:27

给多智能体LLM装上「图记忆工作流路由器」，搞定调用、协作规划

GraphPlanner通过引入图记忆网络，将多智能体LLM的路由过程升级为动态工作流生成。不仅选择调用哪个模型，还决定每个模型应承担的角色，实现任务分解与协作规划。

来自主题: AI技术研报

7389 点击 2026-07-12 10:46

跟AI说“出片穿搭”，它真能听懂！淘宝ShopX让大模型直接“卖货”了

团队提出了ShopX：一个面向agentic shopping的电商大模型。它不仅仅是在搜索框外面套一个会“说话”和“调用工具”的LLM，而是赋予模型直接进入商品空间的能力，让大模型成为商品履约的核心，学会在商品空间中规划、检索、排序、组合和生成结果，进而减少接口损耗。

来自主题: AI技术研报

9329 点击 2026-07-11 11:14

ICML 2026｜如何对Multi-Agent系统进行过程评估？重新认识多智能体系统中的Orchestrator

来自南京大学 NLP 实验室的 ICML 2026 论文 Recognize Your Orchestrator: An Entropy Dynamics Perspective for LLM Multi-Agent Systems 指出：在当前主流的 Orchestrator-Executor 多智能体架构中，系统失败往往并不首先来自某个执行器不会干活，

来自主题: AI技术研报

8451 点击 2026-07-06 15:48

Router的作用被低估了？vLLM这个神器，让单次调用背后藏了一支模型协作小队

vLLM 社区推出的 Semantic Router 除了专注上面三个方向，正在更进一步：我们认为：router 不只是选择模型，还可以提升模型能力。用户不用改权重，也不用让每个 Agent 团队都自己搭一套 Graph，而是在一次普通 Model API 调用的内部，组织出一支有边界、有预算、有验证、有回退的 “小队”。

来自主题: AI技术研报

8783 点击 2026-07-05 09:43

从LLM到JEPA，中国团队正在把“世界模型”搬进细胞内部

最近，AI虚拟细胞（AIVC）赛道，迎来关键突破！作为全球最早布局该领域的企业之一，百曜科技正式发布全球首个基于LLM-JEPA架构的AI虚拟细胞世界模型——AURA CellOS。

来自主题: AI资讯

9218 点击 2026-07-04 11:18

Karpathy又封神！掀翻RAG，把你的笔记变成第二大脑

知识第一次，能像代码一样利滚利。前OpenA 创始团队成员、特斯拉前 AI 高级总监 Andrej Karpathy，提出一个狠招：别再用 RAG 检索你的知识库，让大模型把它「编译」成一座持续生长的活 Wiki。两个多月，他在GitHub屠出 5000+ star。

来自主题: AI资讯

7449 点击 2026-07-01 09:52

给Transformer变个形，LLM竟能变得更聪明

2026 年 6 月，大模型行业正在经历一场前所未有的「开源海啸」：英伟达放出了 550B 参数的混合架构模型，谷歌送出多模态的 Gemma 新版本，智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报

8071 点击 2026-06-30 10:20

陈天奇新书上线：面向ML系统的现代GPU编程

前些天，CMU 助理教授、TVM/XGBoost/MLC-LLM 的创造者陈天奇发布了一本免费在线书籍《Modern GPU Programming For MLSys（面向机器学习系统的现代 GPU 编程）》。

来自主题: AI资讯

8139 点击 2026-06-27 15:49