Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

10457点击 2024-06-21 11:54

Claude大模型又双叒叕更新升级了！

刚刚，OpenAI最强对手Anthropic官宣了Claude 3.5 系列的第一个大模型——Claude 3.5 Sonnet。

各项评估的性能直接吊打Claude 3 Opus 和 GPT-4o，是当前最强大最智能的模型。

大白话解释下——今天Anthropic公司正式官宣的Claude 3.5 Sonnet模型是他们公司迄今为止最智能的模型，这也是3.5型号系列中的第一个版本。

不止如此，Claude作为最贵也是最慢的模型，这次Claude 3.5 Sonnet的速度是 Claude 3 Opus 的两倍，而成本却是 Claude 3 Opus 的五分之一，与上一代中等模型 Claude 3 Sonnet 相当。

效果暴打Claude 3 Opus 和 GPT-4o

话不多说，先看Claude 3.5 Sonnet的效果表现！

在编程、数学、视觉理解、高级推理上的指标都超越了上一代最强的Claude 3 Opus 和 GPT-4o。

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

速度与成本：

Claude 3.5 Sonnet比Claude 3 Opus快两倍，且价格更为亲民，是 Claude 3 Opus 的五分之一。

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

编码能力：

在内部编码评估中，Claude 3.5 Sonnet解决了64%的问题，显著优于Claude 3 Opus的38%。

视觉能力：

Claude 3.5 Sonnet 现在是最强的视觉模型，在所有标准视觉基准上都超过了 Claude 3 Opus。

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

在需要视觉推理的任务中，改进最为明显，例如解释图表、图形或从不完美的图像转录文本。

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

互动新方式：

引入了“Artifacts”功能，这是一项扩展用户与 Claude 交互方式的新功能，使用户能在动态工作空间中实时编辑和构建Claude生成的内容。

比如，当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时，这些工件会出现在他们的对话旁边的专用窗口中。相当于创建了一个动态工作空间，可以在其中实时查看、编辑和构建 Claude 的创作，将模型生成的内容无缝集成到用户的项目和工作流程中。

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

Artifacts 功能标志着 Claude 从对话式 AI 向协作工作环境的演变。

Claude 3.5 Sonnet 为研究生水平推理 (GPQA)、本科水平知识 (MMLU) 和编码能力 (HumanEval) 上都达到最优效果，而且在掌握细微差别、幽默和复杂指令方面有显著改进，这次模型升级，生成文本也更自然、更相关。

而且，Anthropic同时预告，这是Claude 3.5 型号系列中的第一个版本，未来几个月内，Anthropic计划发布Claude 3.5 Haiku和Claude 3.5 Opus。

不说了，小编去试用啦！

文章来源于“夕小瑶科技说”，作者“醒醒”

Claude 3.5 发布！性能超越GPT-4o和Claude 3 Opus！

关键词: Claude 3.5 , Claude 3.5 Sonnet , GPT-4o , AI模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/