为什么今年最赚钱、最容易融资、最容易跑出爆款的 AI 方向,全都指向视频生成?
为什么今年最赚钱、最容易融资、最容易跑出爆款的 AI 方向,全都指向视频生成?如果把今年的AI创业图景抽象成一幅热力分布图,会看到一个异常明亮的区域。它不在模型底座层,不在搜索、办公、投喂式工具链,而是意外地集中在一个节点:视频生成。
如果把今年的AI创业图景抽象成一幅热力分布图,会看到一个异常明亮的区域。它不在模型底座层,不在搜索、办公、投喂式工具链,而是意外地集中在一个节点:视频生成。
Jenny 创立的 Robyn 刚刚完成了 550 万美元的种子轮融资,由 M13 领投,Google Maps 联合创始人 Lars Rasmussen、Canva 早期投资人 Bill Tai、前雅虎 CFO Ken Goldman 等人参与投资。
面对谷歌TPU的攻势,英伟达开始紧张了。
我们以为语言是语法、规则、结构。但最新的Nature研究却撕开了这层幻觉。GPT的层级结构与竟与人大脑里的「时间印记」一模一样。当浅层、中层、深层在脑中依次点亮,我们第一次看见:理解语言,也许从来不是解析,而是预测。
实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。
近年来,基于扩散的视频生成模型的最新进展极大地提高了视频编辑的真实感和可控性。然而,文字驱动的视频对象移除添加依然面临巨大挑战:
不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。
给大模型装上「身体」与「同理心」,为现代人在人生旷野中提供「无条件的积极关注」。
觉得大模型消耗的算力过大,英伟达推出的8B模型Orchestrator化身「拼好模」,通过组合工具降本增效,使用30%的预算,在HLE上拿下37.1%的成绩。
白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家