Stable Diffusion 3深夜横空出世!模型与Sora同架构,也能「理解」物理世界
Stable Diffusion 3深夜横空出世!模型与Sora同架构,也能「理解」物理世界今日份炸弹又来了!深夜,Stability AI放出了Stable Diffusion 3.0,它采用了和爆火Sora同样的DiT架构,画面质量、文字渲染、复杂对象理解大提升,Midjourney、DALL-E 3都显得黯然失色了。
搜索
今日份炸弹又来了!深夜,Stability AI放出了Stable Diffusion 3.0,它采用了和爆火Sora同样的DiT架构,画面质量、文字渲染、复杂对象理解大提升,Midjourney、DALL-E 3都显得黯然失色了。
去年 9 月,国际著名风投机构 a16z 推出了 2023 上半年 AI 产品榜单(按网站流量排名),在《全球流量 Top50 的“AI 网站”出炉:C 端用户都愿意用 AI 干什么?》这篇文章中我们对这份榜单进行了解读。
AI浪潮愈演愈烈的当下,信息量与应用需求迎来彻底爆发,外加参战厂商们急需寻找大模型落地场景,2024年无疑会成为AI应用场域争夺的“修罗场”。
在过去的 2023 年中,大型语言模型(LLM)在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展,似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好,甚至让模型变得更小。
谷歌大模型,开源了!一夜之间,Gemma系列正式上线,全面对外开放。
2023年,AI成了科技圈的热词,新老玩家云集。到了2024年,其热度持续飙升。首先是OpenAI创始人山姆·奥特曼欲为AI芯片项目寻求5-7万亿美元的资金,随后,OpenAI推出了一款视频生成模型“Sora”,引发全球大讨论。
在微调大型模型的过程中,一个常用的策略是“知识蒸馏”,这意味着借助高性能模型,如GPT-4,来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似,把GPT-4等模型视为更接近唯一的逻辑或真理的存在。
一个名为“AI疯人院”的博主在网上发布了一部令人震撼的《猴王问世》动画短片。这部短片利用AI技术制作而成,全长约3分56秒,其令人身临其境的逼真视觉效果让众多网友惊叹不已。
推测解码(Speculative Decoding)是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下,获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。
Sora表现强大的3点关键原因,以及我们作为普通人,应该如何面对新技术带来的冲击?