AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

2026 年 6 月,大模型行业正在经历一场前所未有的「开源海啸」:英伟达放出了 550B 参数的混合架构模型,谷歌送出多模态的 Gemma 新版本,智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报
7795 点击    2026-06-30 10:20
AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

AI助手不该只等人提问:清华团队两项新研究,探索理解用户与适时互动

如今,大模型越来越擅长回答问题了,但当 AI 不再只停留在聊天窗口,而是走向智能眼镜、可穿戴设备乃至家庭机器人时,问题会随之改变。用户未必有时间把需求完整说出来,也未必希望助手随时插话。更理想的助手,应该能在现场真正理解人,在用户需要的时候出现,在不合适的时候保持安静。

来自主题: AI技术研报
6200 点击    2026-06-30 09:55
百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源

随着全球智能体加速落地,算力需求呈指数级爆发,以 GPU 为核心的 AI 基础设施正变得愈发关键。据摩根士丹利报告预测,2028 年全球 AI 基础设施累计总投资将达 2.9 万亿美元。

来自主题: AI技术研报
5715 点击    2026-06-30 09:53
全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

你从桌上端起一杯水,大脑用了不到一秒,同时完成三件事: 估算杯子的重量,预判水面晃动的幅度,顺便绕开了旁边那个玻璃杯。

来自主题: AI技术研报
8550 点击    2026-06-30 09:53
Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

在世界模型这条路上,行业一直卡在一个几乎无解的矛盾里:想要更真实的长程模拟,就必须给模型更深的计算;可一旦把模型做得更深,部署成本、参数规模和误差累积又会迅速抬头。结果就是,大家都知道世界模型要 “想得更久”,却很难让它在现实系统里 “算得起、跑得稳”。

来自主题: AI技术研报
5482 点击    2026-06-29 15:54
Dwarkesh Patel:下一代AI,可能是干活干出来的

Dwarkesh Patel:下一代AI,可能是干活干出来的

Dwarkesh Patel:下一代AI,可能是干活干出来的

硅谷著名科技播客主持人 Dwarkesh Patel 最近抛出了一个问题:AI 的下一代训练范式会是什么?

来自主题: AI资讯
8631 点击    2026-06-29 09:20
ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

近年来,大语言模型展现出了越来越强的能力,从上下文学习(In-Context Learning, ICL)到复杂推理、代码生成,这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报
9075 点击    2026-06-29 09:19
从第一性原理看机器人AI:为什么它比大模型更难?

从第一性原理看机器人AI:为什么它比大模型更难?

从第一性原理看机器人AI:为什么它比大模型更难?

这篇来自 Interlatent(一家聚焦具身智能后训练与部署的早期创业公司) 的文章,试图从第一性原理出发,把现代 AI 机器人技术重新讲清楚:一个机器人到底如何理解世界,如何生成动作,又为什么会在数据、延迟和泛化上遇到如此多的困难。

来自主题: AI技术研报
7403 点击    2026-06-29 09:15