AI资讯新闻榜单内容搜索-LLMs

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLMs

dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型

近年来，扩散大语言模型（Diffusion Large Language Models, dLLMs）正迅速崭露头角，成为文本生成领域的一股新势力。与传统自回归（Autoregressive, AR）模型从左到右逐字生成不同，dLLM 依托迭代去噪的生成机制，不仅能够一次性生成多个 token，还能在对话、推理、创作等任务中展现出独特的优势。

来自主题: AI技术研报

9063 点击 2025-08-20 16:26

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

在大语言模型（LLMs）领域，自回归（AR）范式长期占据主导地位，但其逐 token 生成也带来了固有的推理效率瓶颈。此前，谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量，向业界展现了扩散大语言模型（dLLMs）在推理速度上的巨大潜力。

来自主题: AI技术研报

8833 点击 2025-08-18 17:20

速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎，致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。

来自主题: AI资讯

8810 点击 2025-08-16 15:43

谷歌开源高效文本提取 Python 库LangExtract

谷歌开源高效文本提取 Python 库LangExtract

谷歌开源高效文本提取 Python 库LangExtract

LangExtract 是一个 Python 库，利用大型语言模型（LLMs）从非结构化文本中提取结构化信息，基于用户定义的指令。它可以处理临床笔记或报告等材料，识别并组织关键细节，同时确保提取的数据与源文本对应。

来自主题: AI资讯

7931 点击 2025-08-06 16:34

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

视频大型语言模型（Video LLMs）的发展日新月异，它们似乎能够精准描述视频内容、准确的回答相关问题，展现出足以乱真的人类级理解力。

来自主题: AI技术研报

7893 点击 2025-08-02 12:43

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

近年来，大型语言模型（LLMs）在复杂推理任务中展现出惊人的能力，这在很大程度上得益于过程级奖励模型（PRMs）的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」，负责评估推理过程的每一步，以引导模型的学习方向。

来自主题: AI技术研报

8329 点击 2025-07-28 10:49

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

9612 点击 2025-07-25 09:51

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

扩散语言模型（Diffusion-based LLMs，简称 dLLMs）以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性，成为一个重要的发展方向。

来自主题: AI技术研报

10132 点击 2025-07-23 15:04

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型（Large Language Models，LLMs）技术的迅猛发展，正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力，能够快速读取医学文献、解读病历记录，甚至基于患者表述生成初步诊断建议，有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报

7866 点击 2025-07-23 13:25

多模态大模型存在「内心预警」，无需训练，就能识别越狱攻击

多模态大模型存在「内心预警」，无需训练，就能识别越狱攻击

多模态大模型存在「内心预警」，无需训练，就能识别越狱攻击

多模态大模型崛起，安全问题紧随其后近年来，大语言模型（LLMs）的突破式进展，催生了视觉语言大模型（LVLMs）的快速兴起，代表作如 GPT-4V、LLaVA 等。

来自主题: AI技术研报

10749 点击 2025-07-22 09:55

上一页当前第6页,共21页下一页