AI资讯新闻榜单内容搜索-LLaMA

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报

5899 点击 2024-10-18 13:54

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

英伟达开源了超强模型Nemotron-70B，后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet，仅次于OpenAI o1！AI社区惊呼：新的开源王者又来了？业内直呼：用Llama 3.1训出小模型吊打GPT-4o，简直是神来之笔！

来自主题: AI技术研报

5694 点击 2024-10-17 15:51

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。

来自主题: AI资讯

5766 点击 2024-10-08 17:20

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速「滑跪」

「开源新王」Reflection 70B，才发布一个月就跌落神坛了？ 9月5日，Hyperwrite AI联创兼CEO Matt Shumer在X上扔出一则爆炸性消息—— 用Meta的开源Llama 3.1-70B，团队微调出了Reflection 70B。

来自主题: AI资讯

5496 点击 2024-10-07 13:57

Sebastian Raschka最新博客：从头开始，用Llama 2构建Llama 3.2

十天前的 Meta Connect 2024 大会上，开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文本模型，但也具备多语言文本生成和工具调用能力。Meta 表示，这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性，因为数据无需离开设备。

来自主题: AI资讯

6105 点击 2024-10-06 15:59