AI资讯新闻榜单内容搜索-Llama

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

悬疑小说的最后一页，隐藏着罪犯的真相。《逆转裁判》的法庭上，真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台，o1、Gemini 2.5 Pro等模型化身「侦探」，测试AI的推理极限。

来自主题: AI资讯

8227 点击 2025-04-18 10:37

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

Llama 4被曝在大模型竞技场作弊后，重新上架了非特供版模型。但是你很可能没发现它。因为排名一下子从第2掉到了第32，要往下翻好久才能看到。

来自主题: AI资讯

7898 点击 2025-04-12 12:19

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

Llama 4刚出世就被碾压！英伟达强势开源Llama Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美DeepSeek R1，吞吐量暴涨4倍。关键秘诀，就在于团队采用的测试时Scaling。

来自主题: AI资讯

5690 点击 2025-04-09 18:02

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

刚刚，一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示，Llama 4证明Scaling已经结束了，LLM并不能可靠推理。但更可怕的事，就是全球的AI进步恐将彻底停滞。

来自主题: AI技术研报

7134 点击 2025-04-09 09:49

Llama 4遭竞技场背刺！实锤用特供版刷榜，2000+对战记录公开

Llama 4真要被锤爆了，这次是大模型竞技场（Chatbot Arena）官方亲自下场开怼：

来自主题: AI资讯

3749 点击 2025-04-08 16:15

Llama 4在测试集上训练？内部员工、官方下场澄清，LeCun转发

大家翘首以盼的 Llama 4，用起来为什么那么拉跨？

来自主题: AI资讯

4823 点击 2025-04-08 15:25

Meta回应Llama 4大模型质量争议： Llama 4「开卷作弊」纯属无稽之谈

今日凌晨，Meta AI 部门副总裁 Ahmad Al-Dahle 发文，回应了近日发布的 Llama 4 大模型的争议问题：对于「不同服务中模型质量参差不齐」这一问题，Ahmad Al-Dahle 解释称，由于模型一准备好就发布了，所以 Meta 的团队预计所有公开的应用实现都需要几天时间来进行优化调整，团队后续会继续进行漏洞修复工作。

来自主题: AI资讯

7987 点击 2025-04-08 10:36

Llama 4发布36小时差评如潮！匿名员工爆料拒绝署名技术报告

Meta最新基础模型Llama 4发布36小时后，评论区居然是这个画风：

来自主题: AI资讯

7378 点击 2025-04-07 17:19

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Llama 4本该是AI圈的焦点，却成了大型翻车现场。开源首日，全网实测代码能力崩盘。更让人震惊的是，模型训练测试集被曝作弊，内部员工直接请辞。

来自主题: AI资讯

8979 点击 2025-04-07 13:53

大模型进入千万上下文时代，意味着什么？

今天在各大信息渠道看到 Llama4 发布的消息，一上来就放出三个模型，具体能力这里就不在赘述，相信大家已经多少看到不少介绍了。

来自主题: AI资讯

6047 点击 2025-04-07 09:51