AI资讯新闻榜单内容搜索-大语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大语言模型
ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗?这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报
7342 点击    2025-08-26 12:11
唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。

来自主题: AI技术研报
6836 点击    2025-08-26 11:30
中国AI创业只是少数人的游戏

中国AI创业只是少数人的游戏

中国AI创业只是少数人的游戏

AI一日,人间一年。 大语言模型的战局刚刚尘埃落定,Agent的热潮又汹涌而至。

来自主题: AI资讯
8205 点击    2025-08-25 16:18
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

本文介绍使用四块Framework主板构建AI推理集群的完整过程,并对其在大语言模型推理任务中的性能表现进行了系统性评估。该集群基于AMD Ryzen AI Max+ 395处理器,采用mini ITX规格设计,可部署在10英寸标准机架中。

来自主题: AI技术研报
9753 点击    2025-08-25 09:51
第一名方案公开,代码智能体安全竞赛,普渡大学拿下90%攻击成功率

第一名方案公开,代码智能体安全竞赛,普渡大学拿下90%攻击成功率

第一名方案公开,代码智能体安全竞赛,普渡大学拿下90%攻击成功率

近期多项研究 [1-2] 表明,即使是经过安全对齐的大语言模型,也可能在正常开发场景中无意间生成存在漏洞的代码,为后续被利用埋下隐患;而在恶意用户手中,这类模型还能显著加速恶意软件的构建与迭代,降低攻击门槛、缩短开发周期。

来自主题: AI技术研报
6740 点击    2025-08-24 12:24
快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨大潜力。

来自主题: AI技术研报
6835 点击    2025-08-22 17:23
从繁杂技巧到极简方案:ROLL团队带来RL4LLM新实践

从繁杂技巧到极简方案:ROLL团队带来RL4LLM新实践

从繁杂技巧到极简方案:ROLL团队带来RL4LLM新实践

近年来,强化学习(Reinforcement Learning, RL)在提升大语言模型(LLM)复杂推理能力方面展现出显著效果,广泛应用于数学解题、代码生成等任务。通过 RL 微调的模型常在推理性能上超越仅依赖监督微调或预训练的模型。

来自主题: AI技术研报
6593 点击    2025-08-22 16:35
ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力

ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力

ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力

在科研、新闻报道、数据分析等领域,图表是信息传递的核心载体。要让多模态大语言模型(MLLMs)真正服务于科学研究,必须具备以下两个能力

来自主题: AI技术研报
8030 点击    2025-08-22 10:35
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

在AI浪潮席卷全球的2025年,大语言模型(LLM)已从单纯的聊天工具演变为能规划、决策的智能体。但问题来了:这些智能体一旦部署,就如「冻结的冰块」,难以适应瞬息万变的世界。

来自主题: AI技术研报
7337 点击    2025-08-22 10:23
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。与传统自回归(Autoregressive, AR)模型从左到右逐字生成不同,dLLM 依托迭代去噪的生成机制,不仅能够一次性生成多个 token,还能在对话、推理、创作等任务中展现出独特的优势。

来自主题: AI技术研报
7540 点击    2025-08-20 16:26