AI资讯新闻榜单内容搜索-Llama

黄仁勋对话大客户：别期待 GPT-5 了，等 Llama 4 吧！

今年的图形学顶级会议 SIGGRAPH 2024 上，老黄把扎克伯格请来了。

来自主题: AI资讯

8815 点击 2024-07-31 10:24

大型语言模型（LLM）展现出了令人印象深刻的智能水平。因此，确保其安全性显得至关重要。已有研究提出了各种策略，以使 LLM 与人类伦理道德对齐。然而，当前的先进模型例如 GPT-4 和 LLaMA3-70b-Instruct 仍然容易受到越狱攻击，并被用于恶意用途。

来自主题: AI技术研报

8451 点击 2024-07-30 16:55

LLaMA3-405B的模型效果已经赶上目前最好的闭源模型GPT-4o和Claude-3.5，这可能是未来大模型开源与闭源的拐点，这里就LLaMA3的模型结构、训练过程与未来影响等方面说说我的看法。

来自主题: AI技术研报

8691 点击 2024-07-30 12:03

适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。

来自主题: AI技术研报

9775 点击 2024-07-29 20:20

在Meta的Llama 3.1训练过程中，其运行的1.6万个GPU训练集群每3小时就会出现一次故障，意外故障中的半数都是由英伟达H100 GPU和HBM3内存故障造成的。

来自主题: AI技术研报

9723 点击 2024-07-29 20:16

每3个小时1次、平均1天8次，Llama 3.1 405B预训练老出故障，H100是罪魁祸首？

来自主题: AI资讯

9850 点击 2024-07-29 19:52

不是大模型用不起，而是小模型更有性价比。

来自主题: AI资讯

5570 点击 2024-07-29 17:42

Meta 发布 Llama 3.1 405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 AI 即未来」，再次将开源与封闭的争论推向舞台中央。

来自主题: AI技术研报

7256 点击 2024-07-28 23:19

最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。

来自主题: AI技术研报

8475 点击 2024-07-28 22:00

最近两款大型 AI 模型相继发布。

来自主题: AI技术研报

7761 点击 2024-07-27 20:08