AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

5 月下旬,NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World,共一第一为清华大学电子系博士刘芳甫,核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报
9132 点击    2026-05-30 11:26
被困在考场里的大模型

被困在考场里的大模型

被困在考场里的大模型

昨天,大名鼎鼎的 Claude 4.8 发布了。 科技圈照例是一片欢呼。 看官方放出来的一堆评测数据,依然是碾压级别的,尤其是说代码(Coding)能力有了史诗级的提升,简直像交了一份满分答卷。

来自主题: AI资讯
8443 点击    2026-05-30 10:50
DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

近期,来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为,多任务强化学习不应被视为一个统一优化问题,而应该解耦为两个彼此独立的过程:单任务的在线策略探索 & 多任务能力整合。

来自主题: AI技术研报
8193 点击    2026-05-30 10:49
数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

我去搜了下 MiniCPM5-1B 的数据,发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集:Ultra-FineWeb-L3 :600B tokens,中英文都有,是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报
8551 点击    2026-05-30 10:06
「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车,而他一年前洗澡时就发现了问题

一家名为脸谱心智(FaceMind)的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题,并给出了解法。更有意思的是,就在「马嘉祺」事件前不到两周,全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。

来自主题: AI技术研报
7449 点击    2026-05-30 10:05
清华系团队给大模型织了一张“智能算力电网”

清华系团队给大模型织了一张“智能算力电网”

清华系团队给大模型织了一张“智能算力电网”

所有人都在比谁的模型参数更大,但真正决定AI能不能落地的,其实是另一件没那么性感的事:一颗Token,能不能被稳定、便宜、规模化地生产出来。死磕这件事的,是一支从中国超级计算体系里走出来的年轻团队,是石科技。

来自主题: AI资讯
9103 点击    2026-05-30 10:03
AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说:做一个好的产品经理,是一个我现在想不明白该怎么训练AI去做的事。言外之意,AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据,热招岗位里大模型算法排第一,产品经理排第二,AI产品经理也排到了前五的位置。

来自主题: AI资讯
8356 点击    2026-05-30 00:21
王慧文那个框,框出了AI时代的财富新流向

王慧文那个框,框出了AI时代的财富新流向

王慧文那个框,框出了AI时代的财富新流向

王慧文画的框像是一个聚宝盆,汇集了各方资本的关注。而太平洋另一边的旧金山,上演了类似的财富故事。这些数字给人震撼,但更有意思的问题是,模型可以云端训练,团队可以全球分布,远程办公早已成熟,但AI时代,反倒是更小的框里涌入了更巨量的财富

来自主题: AI资讯
8703 点击    2026-05-29 15:13
马斯克也拥抱C语言了!大模型训练堆栈抛弃JAX,提速一个数量级

马斯克也拥抱C语言了!大模型训练堆栈抛弃JAX,提速一个数量级

马斯克也拥抱C语言了!大模型训练堆栈抛弃JAX,提速一个数量级

不用JAX,SpaceX正在用C语言编写的全新堆栈训练新模型。而且马斯克本人亲口承认,Grok 5已经用的就是这个新堆栈。按马斯克的说法,这种新堆栈能让大模型训练速度提升一个数量级。

来自主题: AI资讯
7509 点击    2026-05-29 15:10
让机器人动作流畅丝滑如「连音」,千寻智能高阳团队提出Legato,入选RSS 2026

让机器人动作流畅丝滑如「连音」,千寻智能高阳团队提出Legato,入选RSS 2026

让机器人动作流畅丝滑如「连音」,千寻智能高阳团队提出Legato,入选RSS 2026

近日,千寻智能高阳团队的研究成果 《Learning Native Continuation for Action Chunking Flow Policies》 被机器人顶会 RSS 2026 接收!这项工作从训练机制出发,让机器人动作天然具有连续性,实现了 "连音" 般的流畅执行,在五个真实世界操作任务上超越了现有方法,为具身智能领域的动作生成研究提供了新的思路。

来自主题: AI技术研报
7944 点击    2026-05-29 15:10