
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。
在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。
Perplexity CEO Aravind Srinivas 近日在接受 TheVerge 采访时表示,「Perplexity 最终的目标是构建像 Windows、Mac、Android 或 iOS 这样的操作系统,操作系统才是最终极的战场。」
在当前大语言模型(LLMs)广泛应用于问答、对话等任务的背景下,如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力,成为 RAG(Retrieval-Augmented Generation)方向的核心挑战。
,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:
六边形战士来了。
近年来,大语言模型(LLMs)在自然语言理解、代码生成与通用推理等任务上取得了显著进展,逐步成为通用人工智能的核心基石。
外媒报道,Manus 最近完成了一轮由美国风险投资公司 Benchmark 领投的 7500 万美元的融资。蝴蝶效应计划利用这笔资金将其服务扩展到包括美国、日本和中东在内的其他市场。据 The Information 上周报道,Manus 使用 Anthropic 的 Claude AI 模型及其他工具,平均每个任务需向 Anthropic 支付 2 美元。
Humane 的创始人 Imran Chaudhri 和 Bethany Bongiorno 曾在苹果参与缔造了 iPhone、iPad 等划时代产品,深谙设计与用户体验之道。这样的背景,自然吸引了大量顶级风投的目光,也让 AI Pin 从一开始就自带“精英”和“颠覆者”的光环。
近日,非凡产研完成了对全球范围内规模以上AI 教育应用的产品收录,共计 88 款。它们的收入情况如何?根据非凡产研数据,全球AI教育App单月营收最大的依然是多邻国(Duolingo),单月破2亿元;而中国教育AI App,收入排行第一的是作业帮旗下出海产品 Question AI。
你是否正在投入大量资源开发基于MCP的Agent,却从未质疑过一个基本假设:MCP真的比传统函数调用更有优势吗? 2025年4月的这项开创性研究直接挑战了这一广泛接受的观点,其执行摘要明确指出:"使用MCPs并不显示出比函数调用有明显改进"。