AI资讯新闻榜单内容搜索-LLama

最强开源编程大模型一夜易主：精通80+语言，仅22B

开源代码大模型的王座，再次易主！来自素有“欧洲OpenAI”之称的Mistral，用22B参数量表现超越了70B的Code Llama。

来自主题: AI资讯

8443 点击 2024-05-30 19:49

每个token只需要5.28%的算力，精度就能全面对标Llama 3。

来自主题: AI技术研报

10740 点击 2024-05-30 15:51

就在刚刚，法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言，而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前，已经开放API与IDE插件供用户使用。

来自主题: AI技术研报

10634 点击 2024-05-30 15:16

大神Karpathy已经不满足于用C语言造Llama了！他给自己的最新挑战：复现OpenAI经典成果，从基础版GPT-2开始。

来自主题: AI技术研报

9484 点击 2024-05-30 10:30

马斯克最近哭穷表示，xAI需要部署10万个H100才能训出Grok 3，影响全球的大模型算力荒怎么解？昨天开源的这款MoE大模型，只用了1/19算力、1/19激活参数，性能就直接全面对标Llama 3-70B！

来自主题: AI技术研报

8604 点击 2024-05-29 15:14

本文由GreenBit.AI团队撰写，团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展，倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案，使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报

9137 点击 2024-05-25 18:15

大模型价格战打得火热这几天，大模型的价格战打得火热。模型价格一降再降，百度、科大讯飞、腾讯甚至直接宣布免费。

来自主题: AI资讯

7025 点击 2024-05-24 12:27

Llama 3发布一个月后，一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目，引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构，甚至让Andrej Karpathy亲自下场「背书」。

来自主题: AI技术研报

10515 点击 2024-05-21 15:20

把大模型塞进手机里需要几步？

来自主题: AI资讯

9768 点击 2024-05-21 09:27

大数据巨头Databricks与哥伦比亚大学最新研究发现，在数学和编程任务上，LoRA干不过全量微调。

来自主题: AI技术研报

3527 点击 2024-05-20 21:03