顾险峰:Sora物理悖谬的几何解释
顾险峰:Sora物理悖谬的几何解释始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。
搜索
始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。
2024年的春天,人类是正在吹起一个史无前例的超级人工智能泡沫,还是开启一个远超工业革命的大繁荣周期,无论是黄仁勋,还是奥特曼和马斯克都是乐观的一方。马斯克略带伤感的回忆8年前黄仁勋向OpenAI赠送Ai系统的一幕,是他无奈的接受超级人工智能的路线之争刚刚开始。
美国时间2月15日,OpenAI公布了文字生成视频大模型Sora。通过输入简短说明文字,Sora就能输出一段时长1分钟、包含多镜头切换、画面元素互动符合真实物理规律的视频,相比起2023年亮相的其他人工智能视频演示,技术突破上了一个台阶。
前几天,英伟达成为首家市值达到2万亿美金的芯片公司,创造了历史。同一时间,一家名为Groq的初创公司横空出世,扬言“三年之内赶超英伟达”。
几天前,ICLR 2024 的最终接收结果出来了。
近日,获悉多模态大模型初创公司香港 Weitu AI 公司完成了天使轮融资,天使轮估值一亿美金。天使轮投资人为拥有全球数亿月活的互联网科技公司和著名天使投资人。据了解,该公司目前刚刚成立,超过半数成员来自北美名校毕业并拥有海外大厂的工作经验。
近日,普林斯顿大学和普林斯顿等离子体物理实验室研究核聚变能的科学家表示,他们已经找到了一种使用人工智能的方法,预测这些潜在不稳定性并实时阻止其发生。
扩散模型,迎来了一项重大新应用——像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层!
AI影响之一是让业余数学家也能做出贡献。
好消息,好消息,真·Sora视频上新了!走过路过不要错过!
谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。
Google DeepMind首席执行官Hassabis最近在接受WIRED采访时表示,AI技术现在还有很大的改进空间,还远没有到只能拼算力的时候。谷歌的优势在于科研能力,未来智能体将改变AI的格局。
2022年底,OpenAI推出人工智能聊天机器人ChatGPT,开启了大模型领域的“竞速跑”模式。2024年2月15日,随着视频生成模型Sora的横空出世,OpenAI再度掀起热潮。
近日,被戏称为“中国AI教父”的李一舟被爆“搬运”中国知名AI模型、AI创作分享社区“LiblibAI”中的模型,并用作商业化。
IDC预计,2024年全球新一代AI手机出货量将达到1.7亿部,约占智能手机整体出货量的15%。其中,在中国市场,预计2024年新一代AI手机出货量为3700万台,2027年将达到1.5亿台,且新一代AI手机所占市场份额超过50%。
近日,声名鹊起的“中国AI第一人”李一舟的AI课程突然被下架,同时,李一舟个人视频号也已被禁止关注。
Dwarkesh 预计,有 70% 左右的概率人们能够通过 scaling 在 2024 年之前实现更强的 AI,这种 AI 能够实现大量认知劳动的自动化,进而促进 AI 的进一步发展。但如果 scaling law 失效,那么实现 AGI 的过程会非常漫长和艰难。
从2014年亚马逊开创性推出Amazon Echo开始,智能音箱横空出世。一开始的智能音箱,也只是有个“嘴”,只能实现播放音乐、查询信息、设置提醒等功能。
英伟达最新大动作来了——通用具身智能体。
视频生成进展如火如荼,Pika迎来一位大将——谷歌研究员Omer Bar-Tal,担任Pika创始科学家。
「从头开始构建GPT分词器」文字版来了。
终有一天,LLM可以成为人类数据专家,针对不同领域进行数据分析,大大解放AI研究员。
困扰可控核聚变的一项重大难题,被AI成功攻克了!普林斯顿团队通过训练神经网络,提前300毫秒就预测了核聚变中的等离子不稳定态,因而能够防止等离子体的逃逸。人类离无穷尽的清洁能源,又近了一步。
Figure AI 在本轮融资之前,估值就已有 20 亿美元了。
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。
最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。
去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。
谷歌刚刷新大模型上下文窗口长度记录,发布支持100万token的Gemini 1.5,微软就来砸场子了。
距离YOLOv8发布仅1年的时间,v9诞生了!
Stable Diffusion 3,它终于来了!