AI资讯新闻榜单内容搜索-模型推理

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存（Feature Caching）方案在追求高倍率加速时，常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报

8330 点击 2026-04-01 16:13

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

长上下文推理已经成了VLM/LLM的默认形态。

来自主题: AI技术研报

6116 点击 2026-04-01 09:40

务工家庭走出00后天才！AI初创公司Axiom宣布完成2亿美元A轮融资

2亿美元A轮融资，估值110亿，成立仅一年就成为独角兽。更震撼的是创始人——25岁的广州00后洪乐潼，父母是从未上过大学的普通务工者。她用数学解决AI最大的痛点：让模型推理步步可验证，彻底杜绝幻觉。为了加入她，弗吉尼亚大学终身教授直接辞职。

来自主题: AI资讯

6946 点击 2026-03-30 10:36

速递！百度投资多模型API聚合平台“AnyInt”，主体公司成立不到半年

《读佳》获悉，百度投资了一家专门做智能多模型推理的平台“AnyInt”，主体公司为上海宏诺伊曼科技有限公司（下简称“宏诺伊曼科技”），本月，百度关联公司北京百度网讯科技有限公司认缴17.6471万元，

来自主题: AI资讯

7696 点击 2026-03-30 09:11

独家｜聚焦大模型推理，水下AI芯片公司斩获10亿元Pre-A轮融资

ZP独家获悉，AI芯片及系统架构研发商“上海昉擎科技”于近日完成 Pre-A3 轮融资，新引入投资人国开科创、钧山资本、建发新兴投资、多维资本，多维资本担任本轮融资财务顾问并担任后续融资独家财务顾问。

来自主题: AI资讯

8945 点击 2026-03-09 10:49

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

9125 点击 2026-02-27 11:35

不是所有token都平等！谷歌提出真·深度思考：思维链长≠深度推理

大模型的思维链越长，推理能力就越强？谷歌Say No——token数量和推理质量，真没啥正相关，因为token和token还不一样，有些纯凑数，深度思考token才真有用。新研究抛弃字数论，甩出衡量模型推理质量的全新标准DTR，专门揪模型是在真思考还是水字数。

来自主题: AI技术研报

8859 点击 2026-02-25 14:32

ICLR 2026 | 数据缺少标注，RL还能稳定诱导模型推理吗？Co-rewarding提供自监督RL学习方案！

针对这一挑战，来自香港浸会大学和上海交通大学的可信机器学习和推理组提出了一个全新的自监督 RL 框架 ——Co-rewarding。该框架通过在数据端或模型端引入互补视角的自监督信号，稳定奖励获取，提升 RL 过程中模型奖励投机的难度，从而有效避免 RL 训练崩溃，实现稳定训练和模型推理能力的诱导。

来自主题: AI技术研报

8628 点击 2026-02-24 15:16

vLLM团队官宣创业：融资1.5亿美元，清华特奖游凯超成为联创

大模型推理的基石 vLLM，现在成为创业公司了。

来自主题: AI资讯

7300 点击 2026-01-23 11:24

让世界模型推理效率提升70倍：上海AI Lab用“恒算力”破解长时记忆与交互瓶颈

上海AI Lab联合多家机构开源的Yume1.5，针对这一核心难题提出了时空信道联合建模（TSCM），在长视频生成中实现了近似恒定计算成本的全局记忆访问。

来自主题: AI技术研报

8115 点击 2026-01-09 14:36