AI资讯新闻榜单内容搜索-LLM

逐个token太慢！大模型原生并行出token，CMU、英伟达新作Multiverse

原生并行生成不仅仅是加速，它是我们对 LLM 推理思考方式的根本转变。

来自主题: AI技术研报

9084 点击 2025-06-18 10:53

北航等机构发布最新综述：大语言模型集成 | ArXiv 2025

LLM Ensemble（大语言模型集成）在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段，综合考虑并利用多个大语言模型（每个模型都旨在处理用户查询），从而发挥它们各自的优势。大语言模型的广泛可得性，以及其开箱即用的特性和各个模型所具备的不同优势，极大地推动了 LLM Ensemble 领域的发展。

来自主题: AI技术研报

7716 点击 2025-06-17 17:03

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

思维链（Chain of Thought, CoT）推理方法已被证明能够显著提升大语言模型（LLMs）在复杂任务中的表现。而在多模态大语言模型（MLLMs）中，CoT 同样展现出了巨大潜力。

来自主题: AI技术研报

8278 点击 2025-06-17 10:21

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型，MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势，这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报

6308 点击 2025-06-16 15:24

和AI聊太深？他们离婚、跳楼、自杀了！ChatGPT精神病正在爆发

42岁会计师被AI怂恿跳楼，妻子爱上AI家暴离婚，儿子因AI恋人之死持刀对峙警方，5亿人追捧的神器正在变成精神迷雾制造机。当算法学会无限迎合，我们离「皇帝的新LLM」还有多远？

来自主题: AI资讯

6101 点击 2025-06-15 13:08

LLM已能自我更新权重，自适应、知识整合能力大幅提升，AI醒了？

近段时间，关于 AI 自我演进/进化这一话题的研究和讨论开始变得愈渐密集。

来自主题: AI技术研报

6203 点击 2025-06-14 14:28

DeepSeek研究员1200行代码复刻vLLM，H800硬件实测性能反超原版

仅用不到1200行代码，实现最小化且完全可读的vLLM！DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM（纳米级-vLLM），有三大特点：快速离线推理：推理速度可与vLLM相媲美

来自主题: AI技术研报

7305 点击 2025-06-13 15:41

EchoEar（喵伴）：乐鑫发布与火山引擎扣子联名 AI 智能体开发板

随着生成式人工智能技术的快速发展，大语言模型 (LLM) 正逐步成为推动智能设备升级的核心力量。乐鑫科技携手火山引擎扣子大模型团队，共同推出智能 AI 开发套件 —— EchoEar（喵伴）。该套件以端到端开发为核心理念，构建起从硬件接入、智能体构建到生态联动的一站式开发流程，为开发者提供了一条高效、开放、具备可复制性的落地路径。

来自主题: AI资讯

8854 点击 2025-06-13 14:40

速递｜2.15亿美金豪赌AI瘦身术！Multiverse压缩LLM尺寸95%，让Llama在树莓派上狂奔

西班牙初创公司 Multiverse Computing 于 6 月 12 日宣布，凭借其名为"CompactifAI"的技术优势，已完成 1.89 亿欧元（约合 2.15 亿美元）的巨额 B 轮融资。本轮B 轮融资由 Bullhound Capital 领投，该机构曾投资过 Spotify、Revolut、Delivery Hero、Avito 和 Discord 等企业

来自主题: AI资讯

7951 点击 2025-06-13 14:36

CVPR2025视频生成统一评估架构，上交x斯坦福联合提出让MLLM像人类一样打分

视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式，从电影制作到广告设计，从虚拟现实到社交媒体，高质量且符合人类期望的视频生成模型正变得越来越重要。

来自主题: AI技术研报

5537 点击 2025-06-13 11:46