
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。
近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。
新模型在MATH上(以数学竞赛为主)动辄跑分80%甚至90%以上,却一用就废。
最近,语音人工智能初创公司 ElevenLabs,在他们的 ElevenReader 应用中推出了一个叫做 GenFM 的功能,这个功能能通过我们上传的内容,快速制作一期由两名 AI 对话交流的播客。
Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。
wwAutoLabeler2.0助力自动驾驶高效数据标注。
遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。
11月26日,我们在硅谷Menlo Park举办了一场主题为「AI机器人与可穿戴设备未来」的线下活动。在「The Right and Cool Way of Building Robots」环节中,我们邀请到K-Scale Labs的 CTO 兼联合创始人 Pawel Budzianowski,一起探讨如何在创业公司中正确而有趣地开发机器人,和围绕这一主题的方方面面。
当前构建数字世界有三条路线:OpenAI的Sora追求视觉真实,谷歌的Genie 2注重实时交互,World Labs专注空间准确。这三条路线各有优势,也各有无法在短期内解决的问题。
Show Lab 和微软推出 ShowUI,这是一个刚刚开源的 UI Agent 模型,在中文 APP 定位和导航能力上表现出色。通过创新的视觉 token 选择和独特的训练数据构建方法,该模型在有限的训练数据下实现了非常棒的性能。
2023年紧急成立的Seed团队,某种程度上承担了AI Lab最初成立时被赋予的角色;