AI资讯新闻榜单内容搜索-tokens

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

全球大模型的军备竞赛，正在“智商”之外开辟新的战场—— 推理速度。

来自主题: AI产品测评

5358 点击 2026-06-11 09:58

雷军：3倍价格10倍速度！小米万亿参数模型MiMo-V2.5-Pro-UltraSpeed模式实现1000 tokens/s狂飙，只需8张GPU

今日，小米MiMo团队与推理系统团队TileRT联合宣布，Xiaomi MiMo-V2.5-Pro的UltraSpeed模式已实现万亿参数（1T）旗舰模型输出速度首次突破1000 tokens/s。

来自主题: AI资讯

9253 点击 2026-06-09 15:32

数据比模型更值钱，国内最大的「端侧」训练数据开源了！600B 预训练+千万级 SFT 核心数据配方公开

我去搜了下 MiniCPM5-1B 的数据，发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集：Ultra-FineWeb-L3 ：600B tokens，中英文都有，是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报

8611 点击 2026-05-30 10:06

月吞100万亿Token！AI中转站OpenRouter赚爆了

每周25万亿tokens的真实流量、估值一年翻倍——OpenRouter拿下1.13亿美元B轮融资。

来自主题: AI资讯

8000 点击 2026-05-27 16:09

ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考

近年来，Chain-of-Thought（CoT）推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报

6888 点击 2026-05-19 10:01

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

智能体时代的核心是算力。

来自主题: AI技术研报

8920 点击 2026-05-08 10:23

不可思议！400B大模型在iPhone上跑起来了

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

9982 点击 2026-05-02 11:02

DeepSeek-V4价格暴降90%！百万token仅2分钱，梁文峰送你token自由

昨晚，DeepSeek-V4又降价了，全系两款模型输入缓存命中的价格直接降至首发价格1/10。最新调价后，DeepSeek-V4-Flash每百万tokens输入（缓存命中）价格为0.02元，DeepSeek-V4-Pro为0.025元。

来自主题: AI资讯

9767 点击 2026-04-27 10:31

速递｜2.5折！DeepSeek V4 Pro限时优惠来了

最新消息是，DeepSeek V4 Pro 2.5折的大力度优惠来啦！官方API文档显示，DeepSeek-V4-Pro模型API限时2.5折优惠，优惠期截至2026年5月5日。具体是这样： 1️⃣百万tokens输入（缓存命中）折后0.25元（原价1元）； 2️⃣百万tokens输入（缓存未命中）折后3元（原价12元）； 3️⃣百万tokens输出折后6元（原价24元）。

来自主题: AI资讯

8861 点击 2026-04-26 10:08

1/10 消耗、0.1美元定价，开发者和中小企业的“省钱模型”来了

4月22日，蚂蚁百灵正式推出Ling-2.6-flash Instruct模型。该模型总参数量为104B，激活参数仅7.4B，核心主打高“Token 效率（Token Efficiency）”。API定价方面，Ling-2.6-flash输入每百万tokens定价0.1美元，输出 0.3 美元。目前，Ling-2.6-flash API已在OpenRouter及百灵tbox平台上线。

来自主题: AI资讯

7935 点击 2026-04-23 17:09