AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机: 即使生成合规答案,超60%的案例中模型并未真正理解风险。

来自主题: AI技术研报
4899 点击    2025-06-10 11:00
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全面时间推理能力,超越671B模型。

来自主题: AI技术研报
6073 点击    2025-06-09 15:54
破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

以神经网络为核心引擎,让AI承担雷达仿真数据生成任务,还实现对雷达物理特性的建模与控制——

来自主题: AI技术研报
7173 点击    2025-06-09 14:58
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。

来自主题: AI技术研报
6029 点击    2025-06-09 14:56
CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团队,主要研究方向为多模态空间智能系统,致力于通过软件和系统的联合优化设计实现空间人工智能的落地。

来自主题: AI技术研报
8078 点击    2025-06-09 14:51
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报
8064 点击    2025-06-09 14:43
LLM已进入「组装」时代,CAIS复合人工智能系统来了

LLM已进入「组装」时代,CAIS复合人工智能系统来了

LLM已进入「组装」时代,CAIS复合人工智能系统来了

2024年,伯克利人工智能研究中心(BAIR)率先提出了一个新概念——复合人工智能系统(Compound AI Systems,简称CAIS)。这个看似简单的术语背后,蕴含着AI系统架构的根本性改变:不再依赖单一LLM的"超级大脑",而是构建多组件协同的"智能生态系统"。

来自主题: AI技术研报
6769 点击    2025-06-09 11:32
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报
6376 点击    2025-06-09 11:02