ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言
9148点击    2024-05-30 15:16

就在刚刚,法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言,而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前,已经开放API与IDE插件供用户使用。


真正Open的AI公司Mistral又低调上新了。


这次,他们发布了首款代码生成模型Codestral,支持80多种编程语言以及32K长上下文窗口。


不仅在基准测试上取得了惊艳的表现,而且代码生成的速度也让试用的网友非常满意。



目前,Codestral提供了多种API,而且模型权重也公开在HuggingFace上。


项目地址:https://huggingface.co/mistralai/Codestral-22B-v0.1/tree/main


代码生成新SOTA


Codestral的训练数据包含80多种编程语言,包括最流行的Python、Java、C、C++和Bash,以及HTML、JavaScript等前端语言,在Swift和Fortran上也有良好表现。


模型可以完成的任务包括编写特定功能的函数、编写测试,以及代码填充。


此外,由于Codestral同时精通英语,也可以与开发人员进行交互,有助于提高工程师的编码水平并减少错误和漏洞。


可以通过Le Chat对话界面免费使用模型的交互功能。


在线地址:https://chat.mistral.ai/chat


作为一个参数量只有22B的模型,Codestral实现了32K的长上下文窗口,是Llama 3 70B的四倍。


Codestral使用了Llama架构,但在7种语言的HumanEval均分超过了CodeLlama,可以和Llama 3打个平手。



RepoBench是一个用于评估存储库级代码补全任务的新基准,考验模型的跨文件检索和理解长上下文能力。在RepoBench上,Codestral使用Python语言达到了SOTA成绩。



此外,在其他语言的评估中,包括C++、bash、Java、PHP、Typescript和C#,Codestral也取得了不错的成绩。



FIM基准可以评估模型在中间填充任务上的性能,但CodeLlama和Llama不直接支持这个功能。


在FIM任务中,Codestral用更少的参数量,在Pyhon、JavaScript和Java三种语言上的分数全面超过DeepSeek Coder 33B。



目前,Mistral开放了两个API供开发者调用Codestral,分别是codestral.mistral.ai和api.mistral.ai,前者有8周的免费测试期,后者按token收费。


此外,还可以通过Continue.dev或者Tabnine插件在VSCode或JetBrains的IDE中使用Codestral的功能。


开发者们已经用上了


基准测试毕竟只是参考,代码工具好不好用,只有试过才知道。


有网友感叹「80种语言太疯狂了」「终于有人想起来Swift了」。



而且实测中可以看到,Codestral的代码生成速度非常快,而且响应延迟也很短。



有人给了GPT-4o和Codestral相同的任务,让它们用Go语言实现基本的发布/订阅系统。


虽然两个模型的响应延迟都很短,但Codestral写完的时候,GPT-4o刚写到一半,生成速度高下立现。



有开发者分析,虽然Codestral不是最大、最好的代码模型,但自己还是会从Claude Opus爬墙,改用Codestral。


因为模型确实包含了更多前沿知识,可以帮助编写最新的AI代码,但ChatGPT和Opus都做不到。



但也有Python工程师吐槽:「没有一个LLM明白,在Python 3.9之后的版本中,就不再需要使用from typing import List了。」


「GPT-4、GPT-4o、Claude Opus、Gemini和Codestral都无法理解这一点。即使明确说明,它们仍然无法理解。」



看来人类程序员剩下的为数不多的优势还有「知错就改」。


参考资料:

https://mistral.ai/news/codestral/


文章来自于微信公众号新智元,作者新智元


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/