就在刚刚,Anthropic宣布,Claude 3.5 Haiku已经可以通过API访问。
与此同时,就在今天,Grok API也官宣正式开启公测。
Claude 3.5 Haiku现已在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供。
Anthropic的开发者关系运营负责人Alex Albert发帖说,「该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。」
性能方面,Claude 3.5 Haiku可谓是表现不俗,已经在接近Sonnet的表现了。
它在编程和代理任务上的表现也超越了除新款3.5 Sonnet外的所有此前Claude模型。
SWE-bench Verified测试衡量了模型解决实际软件问题的能力
AI公司iGent的CEO评价道:「Claude 3.5 Haiku展现了令人印象深刻的推理和代码生成能力,包括展示强大的多轮代码优化功能,使与代码相关的错误减少了60%。它和其他体积更大的模型处于同一水平。」
凭借这些特性,Claude 3.5 Haiku非常适合面向用户的产品、专业化子代理任务,以及从大量数据(如购买历史、定价或库存记录)中生成个性化体验。
基于此,Anthropic列举了一些适用于Haiku的使用场景:
1. 代码补全:Claude 3.5 Haiku提供快速、准确的代码建议和补全,能加速开发工作流。
2. 交互式聊天机器人:凭借增强的对话能力和快速响应,Claude 3.5 Haiku非常适合支持响应迅速的聊天机器人,能够处理大量用户互动。这对需要大规模互动的客户服务、电商和教育平台尤为有价值。
3. 数据提取和标注:Claude 3.5 Haiku能够高效处理和分类信息,使其在快速数据提取和自动化标注任务中表现出色。此功能对处理大量非结构化数据的金融、医疗和研究机构尤为实用。
4. 实时内容审核:Claude 3.5 Haiku通过其改进的推理和内容理解能力,提供可靠的即时内容审核。这对需要大规模维持安全、适当内容的社交平台、在线社区和媒体组织而言非常有价值。
然而,随着性能提升,Haiku的价格提升至之前的4倍!它现在的定价起步为每百万输入tokens $1,每百万输出tokens $5。
看到这个价格,网友们纷纷吐槽「太贵了」!
「Jimmy Apples」感慨道:如今,Anthropic的光芒正在褪去。
比起隔壁的4o-mini,3.5 Haiku在很多基准测试上的表现更差,但价格却更贵。
而网友「John」则特地做了一个Claude 3.5 Haiku和Gemini 1.5 Flash的性能/价格对比。
从表格中不难看出,3.5 Haiku要花多几十倍的钱,但换来的却只有一点点性能提升。
网友「elvis」甚至还画了更直观的柱状图来体现Haiku夸张的涨价幅度——
并对比了Claude 3.5 Haiku和GPT-4o Mini、Gemini 1.5 Flash在MATH Benchmark和GPQA Diamond Benchmark两个基准测试上的表现——
可以看到,比起上一代模型,新版的3.5 Haiku在价格上提升了4倍之多。
而那些表现基本差不多(甚至更好)的同类模型,价格更是「断崖式」地便宜。
当然,网上也不乏有惊喜的欢呼声。
如前所述,由马斯克xAI推出的大模型Grok,也正式开启API的公测了。
到2024年底,每月有25美金免费额度,人人均可参与。
如果你之前已经购买了预付费额度,比如50美元,那么在11月和12月,你每月都能获得75美元(25+50)的免费额度
根据其官方博客介绍:此次,xAI公开了一个全新的Grok模型,代号「grok-beta」,该模型目前正处于开发的最后阶段。
该模型上下文长度为128000 token,这意味着Grok可以处理更长的文本输入,理解更复杂的上下文关系。
此外,该模型不仅支持函数调用,也能支持系统提示词。从而让开发者能够更灵活地控制模型的行为。
这意味着它可以与外部工具进行高效的连接和交互,为各种复杂应用场景的实现提供了可能。
借此机会,xAI还透露,除了纯文本版本外。下周还将发布一个支持图像输入的多模态版本。
也就是说,以后Grok不仅能够读懂文字,也能看懂图片了。
值得一提的是,考虑到开发者的使用体验,xAI的REST API完全兼容Open AI和Anthropic的API,迁移起来也非常简单。
如果你正在使用OpenAI的Python SDK,只需要做两个简单的改动:
- 将base_url改为https://api.x.ai/v1
- 使用在console.x.ai创建的xAI API密钥
就这么简单,你的应用就能无缝切换到Grok了!
参考资料:
https://x.com/AnthropicAI/status/1853498267612438873
https://x.ai/blog/api
文章来自于微信公众号 “新智元”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0