AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

研究揭示早融合架构在低计算预算下表现更优,训练效率更高。混合专家(MoE)技术让模型动态适应不同模态,显著提升性能,堪称多模态模型的秘密武器。

来自主题: AI技术研报
9025 点击    2025-05-06 14:41
AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

科幻中AI自我复制失控场景,正成为现实世界严肃的研究课题。英国AISI推出RepliBench基准,分解并评估AI自主复制所需的四大核心能力。测试显示,当前AI尚不具备完全自主复制能力,但在获取资源等子任务上已展现显著进展。

来自主题: AI技术研报
6361 点击    2025-05-06 13:40
「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

本文深入梳理了围绕DeepSeek-R1展开的多项复现研究,系统解析了监督微调(SFT)、强化学习(RL)以及奖励机制、数据构建等关键技术细节。

来自主题: AI技术研报
6012 点击    2025-05-06 10:53
成熟的编程智能体,已经学会升级自己的系统了

成熟的编程智能体,已经学会升级自己的系统了

成熟的编程智能体,已经学会升级自己的系统了

编程智能体,几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界,都在寻找更高效的落地路径。

来自主题: AI技术研报
7872 点击    2025-05-06 09:13
AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

在这场通往AGI的竞赛中,人类或许正在逐渐走向失控。MIT最新研究指出:即使采用最理想的监督机制,人类成功控制超级智能的概率也仅为52%,而全面失控的风险可能超过90%。

来自主题: AI技术研报
8121 点击    2025-05-04 17:59
DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。

来自主题: AI技术研报
6231 点击    2025-05-04 17:35