AI资讯新闻榜单内容搜索-大语言模型

图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型，触发像素自主推理

自回归（AR）范式凭借将语言转化为离散 token 的核心技术，在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报

9688 点击 2025-05-18 14:28

PDF文件长出「AI大脑」？网友惊呼：这操作太「黑科技」了！

你以为PDF只是用来阅读文档的？这次它彻底颠覆了你的想象！极客Aiden Bai最新整活——直接把大语言模型（LLM）塞进PDF里，打开文件就能让AI讲故事、陪你聊天！更夸张的是，连Linux系统都能在PDF里运行。

来自主题: AI资讯

10062 点击 2025-05-16 15:33

一个提示攻破所有模型，OpenAI谷歌无一幸免！

多年来，生成式AI供应商一直向公众保证，大语言模型符合安全准则，并加强了对产生有害内容的侵害。然而，一种看似简单但非常有效的提示词策略，能够让所有主流大模型开启「无限制模式」。

来自主题: AI资讯

12013 点击 2025-05-15 18:52

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

10353 点击 2025-05-15 17:12

ICML 2025 | 长视频理解新SOTA！蚂蚁&人大开源ViLAMP-7B，单卡可处理3小时视频

在视觉语言模型（Vision-Language Models，VLMs）取得突破性进展的当下，长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例，仅需数分钟即可产生逾百万的视觉 token，这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报

7615 点击 2025-05-13 08:54

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。

来自主题: AI技术研报

9577 点击 2025-05-12 14:51

斯坦福的以弱驭强W4S，用Meta-Agent驾驭更强的LLM，准确率提升至95.4% | 最新

本文详细介绍了斯坦福大学最新提出的"以弱驭强"（W4S）范式，这一创新方法通过训练轻量级的弱模型来优化强大语言模型的工作流。核心亮点包括：

来自主题: AI技术研报

9777 点击 2025-05-12 10:10

独立游戏小团队也能在GDC开讲座？｜AI原生游戏《1001夜》在旧金山的1周收获

一个月前，在旧金山全球游戏开发者大会上，AI原生独立游戏《1001夜》的制作人担任GDC Al Summit的演讲者，分享游戏中大语言模型驱动的核心玩法设计，与世界各地的游戏开发者进行了深入的交流。

来自主题: AI资讯

10466 点击 2025-05-11 14:27

突破多模态奖励瓶颈！中科院清华快手联合提出R1-Reward，用强化学习赋予模型长期推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用：

来自主题: AI技术研报

10246 点击 2025-05-09 11:51

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

11073 点击 2025-05-06 15:07