AI资讯新闻榜单内容搜索-大语言模型

ChatGPT到底学了多少「污言秽语」？清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语，那么我们能学好语言吗？这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报

7342 点击 2025-08-26 12:11

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来，大语言模型（LLMs）展现出强大的语言理解与生成能力，推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等，已经深刻改变了人机交互方式。

来自主题: AI技术研报

6836 点击 2025-08-26 11:30

中国AI创业只是少数人的游戏

AI一日，人间一年。大语言模型的战局刚刚尘埃落定，Agent的热潮又汹涌而至。

来自主题: AI资讯

8205 点击 2025-08-25 16:18

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍使用四块Framework主板构建AI推理集群的完整过程，并对其在大语言模型推理任务中的性能表现进行了系统性评估。该集群基于AMD Ryzen AI Max+ 395处理器，采用mini ITX规格设计，可部署在10英寸标准机架中。

来自主题: AI技术研报

9753 点击 2025-08-25 09:51

第一名方案公开，代码智能体安全竞赛，普渡大学拿下90%攻击成功率

近期多项研究 [1-2] 表明，即使是经过安全对齐的大语言模型，也可能在正常开发场景中无意间生成存在漏洞的代码，为后续被利用埋下隐患；而在恶意用户手中，这类模型还能显著加速恶意软件的构建与迭代，降低攻击门槛、缩短开发周期。

来自主题: AI技术研报

6740 点击 2025-08-24 12:24

快手Klear-Reasoner登顶8B模型榜首，GPPO算法双效强化稳定性与探索能力！

在大语言模型的竞争中，数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练，到 DeepSeek 提出 GRPO 算法，我们见证了强化学习在推理模型领域的巨大潜力。

来自主题: AI技术研报

6835 点击 2025-08-22 17:23

从繁杂技巧到极简方案：ROLL团队带来RL4LLM新实践

近年来，强化学习（Reinforcement Learning, RL）在提升大语言模型（LLM）复杂推理能力方面展现出显著效果，广泛应用于数学解题、代码生成等任务。通过 RL 微调的模型常在推理性能上超越仅依赖监督微调或预训练的模型。

来自主题: AI技术研报

6593 点击 2025-08-22 16:35

ICCV 2025 | ECD：高质量合成图表数据集，提升开源MLLM图表理解能力

在科研、新闻报道、数据分析等领域，图表是信息传递的核心载体。要让多模态大语言模型（MLLMs）真正服务于科学研究，必须具备以下两个能力

来自主题: AI技术研报

8030 点击 2025-08-22 10:35

GPT-5点赞！八大顶尖机构发布「自进化智能体」全面综述

在AI浪潮席卷全球的2025年，大语言模型（LLM）已从单纯的聊天工具演变为能规划、决策的智能体。但问题来了：这些智能体一旦部署，就如「冻结的冰块」，难以适应瞬息万变的世界。

来自主题: AI技术研报

7337 点击 2025-08-22 10:23

dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型

近年来，扩散大语言模型（Diffusion Large Language Models, dLLMs）正迅速崭露头角，成为文本生成领域的一股新势力。与传统自回归（Autoregressive, AR）模型从左到右逐字生成不同，dLLM 依托迭代去噪的生成机制，不仅能够一次性生成多个 token，还能在对话、推理、创作等任务中展现出独特的优势。

来自主题: AI技术研报

7540 点击 2025-08-20 16:26