
李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件
李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件预训练模型能否作为探索新架构设计的“底座” ? 最新答案是:yes!
预训练模型能否作为探索新架构设计的“底座” ? 最新答案是:yes!
4月份,李飞飞教授领先编制的《2025年人工智能指数报告》提供的数据显示,2024年全年具有特殊影响力的模型(Notable AI models)当中,排名前5的几乎都来自美国、中国的科技巨头。
因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。
World Labs 是由著名 AI 专家、斯坦福大学教授李飞飞于 2024 年创办的初创公司,致力于开发具备“空间智能”的下一代 AI 系统。
李飞飞空间智能创业公司World Labs,开源一项核心技术!
什么开源算法自称为DeepSeek-R1(-Zero) 框架的第一个复现?
Qwen 3还未发布,但已发布的Qwen系列含金量还在上升。2个月前,李飞飞团队基于Qwen2.5-32B-Instruct 模型,以不到50美元的成本训练出新模型 S1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今,他们的视线再次投向了这个国产模型。
世界模型领域最新进展,要比拼“世界生成”了。
4月7日,斯坦福以人为本人工智能研究所(HAI)发布《2025年AI指数报告》,这份长达456页的报告,全景展示了过去一年AI领域的关键进展。
2025年斯坦福HAI报告重磅发布,456页深度剖析全球AI领域的最新趋势:中美顶级模型性能差距缩至0.3%,以DeepSeek为代表的模型强势崛起,逼近闭源巨头;推理成本暴降,小模型性能飙升,AI正变得更高效、更普惠。