就在昨天深夜,马斯克的 xAI 悄无声息地扔出了一颗重磅炸弹——Grok 4 Fast!
熟悉 AI 圈的家人们都知道,xAI 的迭代速度堪称恐怖(xAI 到底怎么做到,这么少的开发人员,模型更迭的这这么快。。。)几乎一月一更新。
但这次更新,确实值得说一说,这次 xAI 改变了牌局的玩法,直接把“性价比”这个概念带到了一个新的高度。
用老板马斯克的夸奖来说:“这就是进展!”
别看模型名字里有个“Fast”,这可不是只图快、牺牲智能的“小甜点”:
传送门:https://x.ai/news/grok-4-fast
在过去,有一个规则是公认的—模型的性能和它的“思考成本”(即推理消耗的 token)是成正比的。模型越聪明,调用起来就越贵、越慢。
但 xAI 通过大规模强化学习(RL)技术,把 Grok 4 Fast 的智能“压缩”到了极致,最终的效果是:新模型 Grok 4 Fast 性能几乎与顶级的 Grok 4 持平,但平均节省了 40% 的推理 Token 消耗。
Grok 4 Fast 定价为:
为了让大家有个对比,咱列一下其他家的:
DeepSeek:
Gemini:
更关键的是,Grok 4 Fast 不仅实现了平均 40% 的 Token 节省和极具攻击性的定价,更在各大权威基准测试中取得了“屠榜”级的表现:
1.在推理基准测试中,Grok 4 Fast 在大幅降低 token 成本的同时,全面超越了 Grok 3 Mini:
2.在 LMArena 搜索竞赛中,Grok-4-Fast-Search 以 1163 的 ELO 评分夺得冠军,领先第二名 o3-search 17 分,展现了其在模拟真实世界应用场景中的绝对优势:
在 LMArena 的 Text Arena 中, Grok 4 Fast 排名第八,表现与 grok-4-0709 相当,在同重量级中远远优于同行(所有同等规模的模型排名均在第 18 位或以下):
3.在极度考验语义理解与分类推理能力的纽约时报连线谜题(NYT Connections Benchmark)中,Grok 4 Fast Reasoning 以其卓越的“智商”直接登顶,超越了 GPT-5、Gemini 2.5 Pro 等一系列顶级模型。
4.在著名的“Artificial Analysis 智能指数”中,Grok 4 Fast 仅用 Gemini 2.5 Pro 约二十五分之一的成本,就达到了同等级别的智能表现。
5.更夸张的是它的速度,根据 Artificial Analysis 的独立评测,Grok 4 Fast API 非常快,输出速度高达 344 tokens/秒,大约是 OpenAI GPT-5 API 的 2.5 倍,端到端延迟仅 3.8 秒,是当之无愧目前最快的前沿模型:
6.除了出色的性能,Token 效率是 Grok 4 Fast 的另一大亮点—它使用 6100 万 token 完成了智能指数测试(Gemini 2.5 Pro 用了 9300 万,Grok 4 用了 1.2 亿)。
Grok 4 Fast 通过端到端的工具使用强化学习(RL)进行训练,成为了一个天生的“工具调用大师”,当你给它一个复杂的搜索任务时,它不再是简单地返回一堆链接。它会像一个真正的人类研究员一样:
目前 Grok 的官方已经可以使用 Grok 4 Fast 了!
而且,xAI 还送上了一个福利:Grok 4 Fast 的 API 将在 OpenRouter 和 Vercel AI Gateway 上限时免费提供。 感兴趣的开发者家人们,可以冲了!
咱们小小的测了下 Grok4 Fast,用了测评大模型的几个经典的考题:
首先是草莓和比大小:
这个没问题是意料之内,那再试试编程:
请帮我生成一个小球在六边形内模仿物理规律跳动的网页
表现一言难尽。。都没有小球在网页中出现。
再给你一次机会!
请帮我生成一个网页版本的连连看游戏
这个很丝滑,而且游戏的运行也正确无误!
再看下 Grok 4 Fast 的文笔:
请帮我生成小说 特朗普与外星人的相遇
模型的性能整体看还是可以的,感兴趣的家人们可以再猛猛考验他一下和我们分享 ~
但是非常值得震撼的是,Grok 4 Fast 的发布,再次印证了那个非常可怕的趋势:获取顶尖 AI 智能的成本正在雪崩式下降。
根据数据统计,在过去一年半里,获取 GPT-4 级别智能的成本已经下降了约 500 倍:
而 Grok 4 Fast 的出现,无疑是为这把火又添了一大桶油。。。。
对于开发者而言,这意味着可以用更低的成本构建更强大、更实用的 AI 应用,对于我们普通用户而言,一个更智能、更便宜、更无处不在的 AI 时代,正加速向我们驶来。
文章来自于“夕小瑶科技说”,作者“小鹿”。
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI