
让整个X玩疯了的Veo3,到底怎么样?【附测试提示词】
让整个X玩疯了的Veo3,到底怎么样?【附测试提示词】大家好,我是袋鼠帝 还记得前两天Google IO大会上他们发布的最新视频模型Veo3吗 它可以根据提示自动添加环境音效、背景噪声、音乐和对话,并与画面完美同步 而且生成的视频相当炸裂,已经让我有点分不清虚幻与现实了 比如这位推特大神(Hashem Al-Ghaili)用Veo3制作的视频,相当🐂🍺
大家好,我是袋鼠帝 还记得前两天Google IO大会上他们发布的最新视频模型Veo3吗 它可以根据提示自动添加环境音效、背景噪声、音乐和对话,并与画面完美同步 而且生成的视频相当炸裂,已经让我有点分不清虚幻与现实了 比如这位推特大神(Hashem Al-Ghaili)用Veo3制作的视频,相当🐂🍺
AI是否真正在「思考」乃至产生意识,正成为科学和哲学交汇的核心议题。前OpenAI负责人翁荔认为,增加模型的「思考时间」有助突破复杂推理瓶颈;哈佛等机构则指出思维链可能导致「降智」;而生物学家Mallavarapu断言数字计算机永不可能拥有意识。
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
在个性化教育不断升温的大背景下,哥本哈根初创公司 Alice.Tech 正在悄然推动学习方式的变革。
MedGemma是谷歌 “健康人工智能开发者基础”(Health AI Developer Foundations)计划的核心项目。基于 Gemma 3 架构, MedGemma提供多模态和纯文本两种模型变体,旨在降低医疗 AI 开发门槛。
今天有个爆炸性消息,OpenAI 以 65 亿美元收购了由 Sam Altman 与前苹果首席设计官 Jony Ive 联合创办的 AI 设备初创公司 io。Jony Ive 1992 年加入苹果,是全球最具影响力的工业设计大师之一,主导设计了 iMac、iPhone、iOS 7 等苹果标志性产品,也引领了全球消费电子的设计潮流。
自去年11月底,360刚刚推出纳米AI搜索的时候,AI真探社就曾发过一篇文章跟进报道。当时国内的AI搜索赛道还是一片蓝海,除了百度作为ALL IN AI时代的代表以外,也就天工搜索和秘塔AI搜索还在这个赛道里面,所以我们当时和主流观点一样,认为360这个老牌搜索大厂的入局或能起到一个鲶鱼效应,甚至有再现曾经百度搜索对打360搜索的名场面的可能性:
OpenAI 的 GPT-4o 在图像理解、生成和编辑任务上展现了顶级性能。流行的架构猜想是:
普林斯顿大学与字节 Seed、北大、清华等研究团队合作提出了 MMaDA(Multimodal Large Diffusion Language Models),作为首个系统性探索扩散架构的多模态基础模型,MMaDA 通过三项核心技术突破,成功实现了文本推理、多模态理解与图像生成的统一建模。
Mistral沉默好久,果然在憋大招。