AI 视频的下一步:不是剪辑,是模拟|Sora 2 团队
AI 视频的下一步:不是剪辑,是模拟|Sora 2 团队最近,OpenAI 宣布:Sora 2 进一步开放使用权限,不再需要邀请码。
最近,OpenAI 宣布:Sora 2 进一步开放使用权限,不再需要邀请码。
我们长期把LLM当成能独闯难关的“单兵”,在很多任务上,这确实有效。
目前,95 后拉斐尔·凯(Raphael Kay)是一名美国哈佛大学的在读博士生。尽管还是一名学生,但他在 2025 年初依托黏菌在美国创办了一家名为 Mireta 的初创公司,他带领公司将 5 亿年前黏菌的生长规律转化为了城市设计工具,助力于开发更高效、更有弹性的城市网络。
来自AI语音独角兽公司ElevenLabs,刚刚发布了Scribe v2 Realtime实时语音转文本模型,网友表示:Next-Level。150毫秒的超低延迟,93.5%的高准确率,还覆盖了90多种语言。
最近,谷歌AI Studio上的一个神秘模型不仅成功识别了200多年前一位商人的「天书」账本,而且还修正了里面的格式错误和模糊表述,展现出的推理能力令历史学家震惊。
曾在英伟达身上错过2500亿美金的孙正义,如今再次用脚投票,他赌的是:AI的未来,不在于制造铲子的英伟达,而在于定义金矿的OpenAI。
华中科技大学团队推出首个水下多模态大模型NAUTILUS,支持8种水下场景理解任务,并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题,性能超越现有模型,恶劣环境下表现更佳。
在学校里,用白色字体凑字数,原本都是土到不能再土的招数了,现在都没什么人用了。没想到,2025 年了,居然还能派上用场。
一位在互联网上近乎「隐形」的27岁创始人,却同时赢得奥特曼与孙正义的重注,豪言要打造一个「现代贝尔实验室」。
创意工作流的“奇点”已经到来。曾经耗费团队数周的角色设计、风格探索和分镜绘制,如今在Nano Banana中被压缩到几分钟。高度一致的角色、一键迁移的风格、拖拽完成的复杂编辑。