AI资讯新闻榜单内容搜索-eva

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型（MRMs）在提升多模态大语言模型（MLLMs）的表现中起着至关重要的作用，在训练阶段可以提供稳定的 reward，评估阶段可以选择更好的 sample 结果，甚至单独作为 evaluator。

来自主题: AI技术研报

9124 点击 2025-05-12 14:51

AI 月报丨大模型下半场与产品成败的关键；拥有更多用户可能会让模型更强；全球算力投资又凉了一些

2025 年 4 月的 AI 月报，你会看到：“评估（Evals）” 成为模型和 AI 产品开发的关键词；Google 继续提升 Gemini 模型能力的思路； OpenAI 的 GPT-4o 为什么变得谄媚，以及背后的问题；用户规模与模型能力提升关系不大？可能要有变化了

来自主题: AI资讯

9285 点击 2025-05-11 20:24

速递｜“让AI像人类一样协作”：Relevance AI融资3700万美金，打造企业“数字员工”流水线

随着AI Agent 在工作场所日益普及，个人可能会与之紧密协作。波士顿咨询集团报告指出，未来五年内，AI Agent 市场预计将以45%的复合年增长率扩张。

来自主题: AI资讯

11532 点击 2025-05-07 14:38

GPT-4o医学知识覆盖率仅55%？腾讯优图团队发布大模型医疗能力“体检报告”

医疗大模型知识覆盖度首次被精准量化！

来自主题: AI技术研报

10436 点击 2025-04-30 17:34

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

在当前大语言模型（LLMs）广泛应用于问答、对话等任务的背景下，如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力，成为 RAG（Retrieval-Augmented Generation）方向的核心挑战。

来自主题: AI技术研报

9139 点击 2025-04-29 08:55

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了！

来自主题: AI技术研报

8048 点击 2025-04-09 17:37

颠覆传统信息搜索，效果是之前SOTA的三倍？UIUC韩家炜、孙冀萌团队开源DeepRetrieval，让模型端到端地学会搜索！

在信息检索系统中，搜索引擎的能力只是影响结果的一个方面，真正的瓶颈往往在于：用户的原始 query 本身不够好。

来自主题: AI技术研报

8699 点击 2025-04-08 14:36

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准，通过整合8500+个LLM在12个主流Benchmark上的2亿条性能记录。将大模型路由问题转化为标准的分类任务，使研究者可在单卡甚至笔记本电脑上开展前沿研究。

来自主题: AI技术研报

6508 点击 2025-04-08 14:26

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一个高效的蒸馏扩散模型，专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏（sCM）和潜空间对抗蒸馏（LADD）的混合蒸馏策略，SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像，在速度和质量的权衡方面树立了新的标杆。

来自主题: AI技术研报

10042 点击 2025-03-31 16:16

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

事关路由LLM（Routing LLM），一项截至目前最全面的研究，来了——

来自主题: AI技术研报

9375 点击 2025-03-19 14:45

AI资讯新闻榜单内容搜索-eva

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

AI 月报丨大模型下半场与产品成败的关键；拥有更多用户可能会让模型更强；全球算力投资又凉了一些

速递｜​“让AI像人类一样协作”：Relevance AI融资3700万美金，打造企业“数字员工”流水线​​

GPT-4o医学知识覆盖率仅55%？腾讯优图团队发布大模型医疗能力“体检报告”

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

颠覆传统信息搜索，效果是之前SOTA的三倍？UIUC韩家炜、孙冀萌团队开源DeepRetrieval，让模型端到端地学会搜索！

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

真·MoE？路由LLM最全面探索：一种笔记本也能玩的大模型Scaling Up研究

速递｜“让AI像人类一样协作”：Relevance AI融资3700万美金，打造企业“数字员工”流水线