AI资讯新闻榜单内容搜索-Llama-3

340B险胜70B，Kimi机器人贴脸“嘲讽”英伟达新开源模型

排名超过Llama-3-70B，英伟达Nemotron-4 340B问鼎竞技场最强开源模型！

来自主题: AI资讯

10560 点击 2024-06-20 10:02

通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。

来自主题: AI技术研报

11419 点击 2024-06-17 19:32

性能超越 Llama-3，主要用于合成数据。

来自主题: AI技术研报

12893 点击 2024-06-15 15:40

大模型领域，开源与闭源之争一直是技术和产业界关注的焦点。阿里云通义千问最新发布的Qwen2系列模型，为这场争论提供了最新的答案。

来自主题: AI资讯

10582 点击 2024-06-07 14:50

Qwen 系列会是众多大学实验室新的默认基础模型吗？斯坦福团队套壳清华大模型的事件不断发酵后，中国模型在世界上开始得到了更多关注。不少人发现，原来中国已经有不少成熟的大模型正在赶超国外。

来自主题: AI资讯

11700 点击 2024-06-07 14:31

终于，AI大神李沐回来了！带着他的大模型创业最新成果——

来自主题: AI资讯

11042 点击 2024-06-06 17:40

本文由GreenBit.AI团队撰写，团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展，倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案，使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报

10082 点击 2024-05-25 18:15

在发布一周年之际，阿里云通义千问大模型在闭源和开源领域都交上了一份满意的答卷。国内的开发者们或许没有想到，有朝一日，他们开发的 AI 大模型会像出海的网文、短剧一样，让世界各地的网友坐等更新。甚至，来自韩国的网友已经开始反思：为什么我们就没有这样的模型？

来自主题: AI资讯

7870 点击 2024-05-10 10:05

Llama-3 刚发布没多久，竞争对手就来了，而且是可以在手机上运行的小体量模型。

来自主题: AI资讯

10290 点击 2024-04-24 10:41

这两天，FlashAttention团队推出了新作：一种给Transformer架构大模型推理加速的新方法，最高可提速8倍。该方法尤其造福于长上下文LLM，在64k长度的CodeLlama-34B上通过了验证

来自主题: AI技术研报

5667 点击 2023-10-18 14:43