刚刚,xAI 正式上线 Grok 3 API,一次性推出4种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic等也推出新的定价策略。
GenAI竞争,越来越激烈了。
据Similar Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户,差距不足5万。
就在昨天,谷歌面向开发者推出全新套餐体系,其中标准套餐对个人开发者免费开放,可免费使用 Gemini 代码助手。
谈及API价格策略,AI巨头各出奇招:
xAI,正式向公众开放了Grok 3系列API!
目前,Grok 3和 Grok 3 Mini均处于Beta测试阶段,支持常规模式与快速模式。
Grok-3和Grok-3-fast使用的是相同的基座模型,提供相同的响应质量。
它们的区别在于服务方式:Grok-3-fast运行在更快的基础设施上,响应速度显著高于标准版grok-3,但其输出token的成本也更高。
Grok-3和grok-3-fast指向的是相同的模型。
对于grok-3-mini和grok-3-mini-fast也是如此。
它们本质上是相同的模型,唯一的区别是响应延迟。
可用模型列表:
在文档中,xAI展示了几个示例。
比如对话补全,可以流式传输响应,用户向xAI API端点发送请求。
API处理该请求后返回完整的响应。
import os
from openai import OpenAI
client = OpenAI(
api_key="<YOUR_XAI_API_KEY_HERE>",
base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create(
model="grok-3-latest",
messages=[
{"role": "system", "content": "You are a PhD-level mathematician."},
{"role": "user", "content": "What is 2 + 2?"},
],
)
print(completion.choices[0].message)
响应:
ChatCompletionMessage(
content='2 + 2 equals 4.',
refusal=None,
role='assistant',
audio=None,
function_call=None,
tool_calls=None
)
Gemini系列模型推出了免费的Gemini 2.5 Pro、 2.0 Flash等最新模型。
而且除了使用的模型不同,以及部分功能每日请求次数的限制,免费版几乎和付费版没有什么不同
今天,Anthropic推出了Max套餐:最低100美元,专为那些重度使用Claude并且需要更多使用次数,完成重要工作的用户设计。
Llama 4 Maverick 相较于平均水平更为便宜,定价为每百万token为0.36美元。
在ARC-AGI的半私有评估中,Llama 4 Maverick非常具有性价比:
- ARC-AGI-1:每个任务只要0.0078美元
- ARC-AGI-2:每个任务只要0.0121美元
此前,o3被爆出在ARC-AGI测试中烧3万美元解决一道题,试错1024次!
参考资料:
https://x.com/Similarweb/status/1909947139301482768
https://x.com/testingcatalog/status/1910101992887771342
https://www.reddit.com/r/singularity/comments/1jvbgea/google_developer_program_plans_pricing/
https://x.com/arcprize/status/1909659233324548402%20%20
https://www.anthropic.com/news/max-plan
文章来自于“新智元”,作者“KingHZ”。