AI 视频的下一步:不是剪辑,是模拟|Sora 2 团队
AI 视频的下一步:不是剪辑,是模拟|Sora 2 团队最近,OpenAI 宣布:Sora 2 进一步开放使用权限,不再需要邀请码。
最近,OpenAI 宣布:Sora 2 进一步开放使用权限,不再需要邀请码。
如今的聊天机器人无所不能,只要是能用文字表达的内容,无论是恋爱建议、工作文书,还是编程代码,AI 都能生成,哪怕不完美。但几乎所有聊天机器人都有一个绝不会做的事:主动结束与你的对话。
「你的大脑,非常容易被操控。」Perplexity CEO Aravind Srinivas这样警告。他说AI陪伴应用太拟人、太危险,可能让人沉溺虚拟世界。可就在他发出警告之前,全球已有上千万用户在和这些AI聊天、倾诉、恋爱。AI真的在夺走现实吗?还是,它只是让我们重新定义了「真实」的样子?
我们长期把LLM当成能独闯难关的“单兵”,在很多任务上,这确实有效。
目前,95 后拉斐尔·凯(Raphael Kay)是一名美国哈佛大学的在读博士生。尽管还是一名学生,但他在 2025 年初依托黏菌在美国创办了一家名为 Mireta 的初创公司,他带领公司将 5 亿年前黏菌的生长规律转化为了城市设计工具,助力于开发更高效、更有弹性的城市网络。
来自AI语音独角兽公司ElevenLabs,刚刚发布了Scribe v2 Realtime实时语音转文本模型,网友表示:Next-Level。150毫秒的超低延迟,93.5%的高准确率,还覆盖了90多种语言。
没有直播,OpenAI一早放大招,让所有人猝不及防。就在刚刚,GPT-5.1正式发布,GPT-5系列重大升级版登场!一共有三个版本,目前已经上线了前两个: GPT-5.1 Instant :最常用的模型,语气更亲切、更智能,更善于遵循指令,GPT-5.1 Thinking :先进的推理模型,更易于理解,处理简单任务速度更快,处理复杂任务更具持久力。
最近,谷歌AI Studio上的一个神秘模型不仅成功识别了200多年前一位商人的「天书」账本,而且还修正了里面的格式错误和模糊表述,展现出的推理能力令历史学家震惊。
就在今天,罗福莉以C位之姿,首次对外官宣了小米任职。刚刚,罗福莉在X上高调宣布——正式加入小米,出任MiMo团队负责人。智能的进化必然会从语言世界走向物理世界,解锁多模态的空间智能——具备感知、推理、生成与行动的能力,这是实现真正通用人工智能(AGI)的关键一步。
曾在英伟达身上错过2500亿美金的孙正义,如今再次用脚投票,他赌的是:AI的未来,不在于制造铲子的英伟达,而在于定义金矿的OpenAI。
家人们,今天上午我被 Kimi 一个 0.99 元的订阅游戏给彻底“套头”了。。。。
华中科技大学团队推出首个水下多模态大模型NAUTILUS,支持8种水下场景理解任务,并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题,性能超越现有模型,恶劣环境下表现更佳。
复杂的简历,AI也能读懂了。
在数字经济浪潮中,企业对于高效、精准的信息获取与决策支持的需求日益迫切。从前沿科学探索到行业趋势分析,再到企业级决策支持,一个能够从海量异构数据源中提取关键知识、执行多步骤推理并生成结构化或多模态输出的「深度研究系统」正变得不可或缺。
华为在世界模型上又有新动作:投了一家物理AI公司。
在学校里,用白色字体凑字数,原本都是土到不能再土的招数了,现在都没什么人用了。没想到,2025 年了,居然还能派上用场。
AI To B 突围的新解法就在非共识里。
“我最近喉咙像刀割一样痛,还伴随鼻塞,但没有咳嗽……这是染上流感,还是又中招了?”
开发者最常使用的编程语言是什么?相信很多人都会不假思索地选择 Python。
一位在互联网上近乎「隐形」的27岁创始人,却同时赢得奥特曼与孙正义的重注,豪言要打造一个「现代贝尔实验室」。
硅谷华人大三学生创立的教育类 AI 产品 VideoTutor,近日宣布完成 1100 万美元种子轮融资,成为硅谷学生创业中融资规模最高的项目。
浙江大学和新加坡南洋理工大学新研究旨在探索空间碳中和数据中心的可行性。太空环境具备两大独特优势:丰富的太阳能可为计算设备提供清洁稳定的电力;接近绝对零度的深空环境则为服务器废热提供了理想的散热条件。
创意工作流的“奇点”已经到来。曾经耗费团队数周的角色设计、风格探索和分镜绘制,如今在Nano Banana中被压缩到几分钟。高度一致的角色、一键迁移的风格、拖拽完成的复杂编辑。
这是一期慢慢碰撞出来,而且在录制完毕后仍然没有“结束”的播客。让我讲一讲它的缘起:
麦肯锡刚刚发布了2025年AI最新报告,一组数据让人“破防”:88%的组织都在用AI,但只有39%的组织吃出了“真金白银”。这份《The state of AI in 2025》回答了AI时代大家都很关心的一个问题:
天下 AI Coding 产品如过江之鲫。正当我们在策划「Vibe Coding 产品千千万,谁是你的 No.1」活动时,我们发现了 ZOER.AI,让我们眼前一亮。ZOER.AI 是一个主打「Database-First」(数据库优先)的全栈应用构建平台,旨在解决当前 AI Coding 工具「前端能力强、后端能力弱」的结构性问题。
四个审稿人全给6分,NeurIPS唯一满分论文炸了!
AMD半年发起4笔AI收购。
一场针对四五线城市老年人的“AI围猎”正在上演。
Kimi K2 Thinking训练真的只花了460万美元?杨植麟亲自带队,月之暗面创始团队出面回应了。这不是官方数据。训练成本很难计算,因为其中很大一部分用于研究和实验。他们还透露训练使用了配备Infiniband的英伟达H800,GPU数量也比巨头的少,但充分利用了每一张卡。