AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

VaseVQA：考古领域实现专家级，诊断+补弱RL框架

VaseVQA：考古领域实现专家级，诊断+补弱RL框架

VaseVQA：考古领域实现专家级，诊断+补弱RL框架

在文化遗产与人工智能的交叉处，有一类问题既美也难：如何让机器「看懂」古希腊的陶器——不仅能识别它的形状或图案，还能推断年代、产地、工坊甚至艺术归属？有研究人员给出了一条实用且富有启发性的答案：把大型多模态模型（MLLM）放在「诊断—补弱—精细化评估」的闭环中训练，并配套一个结构化的评测基准，从而让模型在高度专业化的文化遗产领域表现得更接近专家级能力。

来自主题: AI技术研报

7941 点击 2025-10-29 09:53

让VLM学会「心中有世界」：VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

让VLM学会「心中有世界」：VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

让VLM学会「心中有世界」：VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

当今的 AI 智能体（Agent）越来越强大，尤其是像 VLM（视觉-语言模型）这样能「看懂」世界的智能体。但研究者发现一个大问题：相比于只处理文本的 LLM 智能体，VLM 智能体在面对复杂的视觉任务时，常常表现得像一个「莽撞的执行者」，而不是一个「深思熟虑的思考者」。

来自主题: AI技术研报

8365 点击 2025-10-28 09:26

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

大模型Agent帮你自动操作电脑，理想很丰满，现实却骨感。

来自主题: AI技术研报

8392 点击 2025-10-27 16:56

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。

来自主题: AI技术研报

8665 点击 2025-10-27 16:46

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询，其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%，即便用户的提问涉及操纵、欺骗或其他人际伤害等情境，模型仍倾向于给予肯定回应。

来自主题: AI技术研报

7413 点击 2025-10-27 15:57

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

聚焦大型语言模型（LLMs）的安全漏洞，研究人员提出了全新的越狱攻击范式与防御策略，深入剖析了模型在生成过程中的注意力变化规律，为LLMs安全研究提供了重要参考。论文已被EMNLP2025接收

来自主题: AI技术研报

6702 点击 2025-10-27 10:25

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

近期，来自北航等机构的研究提出了一种新的解决思路：自回归奖励引导表征编辑（ARGRE）框架。该方法首次在 LLM 的潜在表征空间中可视化了毒性从高到低的连续变化路径，实现了在测试阶段进行高效「解毒」。

来自主题: AI技术研报

6755 点击 2025-10-26 10:28

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

大型语言模型（LLM）本身很强大，但知识是静态的，有时会“胡说八道”。为了解决这个问题，我们可以让它去外部知识库（比如维基百科、搜索引擎）里“检索”信息，这就是所谓的“检索增强生成”（RAG）。

来自主题: AI资讯

8275 点击 2025-10-25 14:09

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

为破解大模型长思维链的效率难题，并且为了更好的端到端加速落地，我们将思考早停与投机采样无缝融合，提出了 SpecExit 方法，利用轻量级草稿模型预测 “退出信号”，在避免额外探测开销的同时将思维链长度缩短 66%，vLLM 上推理端到端加速 2.5 倍。

来自主题: AI技术研报

8995 点击 2025-10-24 16:53

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

全球六大LLM实盘厮杀，新王登基！今天，Qwen3 Max凭借一波「快狠准」操作，逆袭DeepSeek夺下第一。Qwen3 Max，一骑绝尘！而GPT-5则接替Gemini 2.5 Pro，成为「最会赔钱」的AI。照目前这个趋势，估计很快就要跌没了……

来自主题: AI资讯

9956 点击 2025-10-23 16:48

上一页当前第24页,共152页下一页