AI资讯新闻榜单内容搜索-Llama3

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

在大语言模型（LLMs）领域，自回归（AR）范式长期占据主导地位，但其逐 token 生成也带来了固有的推理效率瓶颈。此前，谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量，向业界展现了扩散大语言模型（dLLMs）在推理速度上的巨大潜力。

来自主题: AI技术研报

6063 点击 2025-08-18 17:20

Z Tech｜独家解读Meta朱泽园开源新基线，用10%算力跑赢Llama3-8B，科学方法引领新范式，语言模型物理学迈入新时代

《Physics of Language Models（语言模型物理学）》，正是将AI研究带入“物理学范式”的项目，由Meta FAIR研究院的朱泽园概念化发起，并统筹设计。

来自主题: AI资讯

5541 点击 2025-08-02 14:04

400万token新SOTA！英伟达UIUC联手：兼顾长短上下文顶尖性能

来自英伟达和UIUC的华人团队提出一种高效训练方法，将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录！基于Llama3.1-Instruct打造的UltraLong-8B模型，不仅在长上下文基准测试中表现卓越，还在标准任务中保持顶尖竞争力。

来自主题: AI技术研报

6880 点击 2025-05-01 13:54

GPU 维修那些事： H100 哪里容易坏？以 Llama3 训练大模型为例

根据去年2024年7月28日Meta公司在训练大模型（Llama 3）时使用“16384 个英伟达H100 GPU 集群”的经验，该显卡在高负载、大规模集群运行环境下容易出现以下故障点：

来自主题: AI技术研报

9383 点击 2025-04-07 09:17

达摩院开源VideoLLaMA3：仅7B大小，视频理解拿下SOTA | 在线可玩

7B大小的视频理解模型中的新SOTA，来了！

来自主题: AI技术研报

6396 点击 2025-02-14 15:23

传统PC巨头IBM发布了最新的Granite3.1模型，跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

IBM 正式发布了其新一代开源大语言模型 Granite 3.1，这是一组轻量级、先进的开源基础模型，支持多语言、代码生成、推理和工具使用，能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯

8553 点击 2024-12-25 09:57

微软出招！新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议：midtraining

OpenAI谷歌天天刷流量，微软也坐不住了，推出最新小模型Phi-4。参数量仅14B，MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。

来自主题: AI技术研报

6835 点击 2024-12-13 15:14

Claude Artifacts的开源实现，Llama3驱动的AI程序员，瞬间做一个软件还能实时渲染。

Llamacoder是Claude Artifacts的开源实现。最大的亮点就是，左侧AI写代码，右侧实时渲染。之前给大家推荐过一个基于Claude做的，Llamacoder是用了Meta 的 Llama 3.1 405B 作为底层语言模型。

来自主题: AI资讯

6180 点击 2024-12-01 11:55

在线可玩！智谱开源图生视频模型，网友直呼Amazing！

刚刚，智谱把清影背后的图生视频模型CogVideoX-5B-I2V给开源了！（在线可玩）一起开源的还有它的标注模型cogvlm2-llama3-caption。

来自主题: AI资讯

3976 点击 2024-09-19 14:54

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报

7602 点击 2024-08-31 14:54