# 热门搜索 #
搜索
斯坦福天才少女一年缔造5亿美元独角兽!Pika再获8000万美元融资,金牌团队阵容首度曝光
8064点击    2024-06-08 11:36

斯坦福天才少女的这家公司,依然在继续它的传奇。


成立一年之际,Pika迎来最好的生日礼物——新一轮约8000万美元的融资。



至此,公司估值较上一轮融资已经整整翻了一番,接近5亿美元。



Pika联合创始人郭文景(Demi Guo)和孟辰霖(Chenlin Meng)


本轮融资由Spark Capital领投,而参与投资的,涵盖了科技和娱乐领域各大投资公司,以及个人投资者,包括Greycroft、Lightspeed、Neo、Makers Fund、著名演员Jared Leto和大西洋唱片公司CEO Craig Kallman等。


此外,这次的名单中还包括了去年11月就参与投资的「老熟人」,比如前Github CEO Nat Friedman、Quora创始人Adam D'angelo、Perplexity CEO Aravind Srinivas、HuggingFace CEO Clément Delangue、ElevenLabs联创Mateusz Staniszewski,以及AI大牛Andrej Karpathy等。



这一切无不表明,市场对生成式AI的未来信心巨大,科技、影视、文娱……要被AI视频「改造」的领域,还数不胜数!


回想7个月前,刚刚发布的Pika 1.0就效果炸裂,以电影般的质感、动画级的特效,掀起了AI生视频领域的大地震。


虽然如今经过Sora的洗礼,我们对AI视频的视效阈值已经一再被拉高,但当时横空出世的Pika 1.0,相比Gen-2等竞品,堪称一句「划时代」。


值得一提的是,Adobe在4月的时候钦定了三大视频AI合作商:Pika、Runway,以及估值860亿美元的OpenAI。



Sora、Pika、Gen-2三个工具同时登陆Premiere Pro


如今,「每个人都能成为自己的视频导演」,这句口号听来依旧震撼。


成为视频领域的Anthropic


在一周年之际,创始人郭文景对新智元表示——


「Pika想要构建更强大的视频大模型。而此次融资的目的,就是希望能够更加积极地训练大模型。」


是的,Pika希望成为的,就是AI视频领域的Anthropic。


这一轮Pika的新领投Yasmin Razavi,此前也是Anthropic的领投。


在Anthropic还没公开模型和产品时,Yasmin就选择相信这个团队,领投了Anthropic,并成为董事会成员。


现在,Yasmin也成为Pika最新的董事会成员。



6位IOI金牌得主,包揽9块金牌


今天,我们要讲的除了创始人故事之外,还有团队背后鲜有人知的内容。


工程团队


在Pika的团队中,共有6位IOI金牌得主,包揽9块国际奥赛金牌,其中3位还是IOI世界第一。


这一数字,甚至超过了前段时间爆火的AI工程师Devin,背后的初创Cognition Al的「金牌程序员」——5位金牌得主,10块金牌。



其中,创始人郭文景摘取了IOI银牌,是美国队十几年来唯一的女国家队队员,也是美国国家队教练。


另一位创始人陈思禹(Karli Chen)更是鲜有的双料国家集训队成员,曾在IOI集训队获得国内前12名,也是全国物理竞赛金牌获得者。


而且,Pika工程团队中还有两个人获得了美国大学最高数学奖项,被认定为Putnam Fellow。


Putnam Fellow是被认为特难的数学竞赛,每年选出5位个人成绩最好的人,将由美国数学协会颁发。



科研团队


在科研方面,Pika团队的实力也不容小觑。


他们纷纷来自世界最好的大学和科研机构,斯坦福、MIT、谷歌、Meta、OpenAl等等。


既有有连发几十篇论文的科研大牛,也有著名开源项目的主要开发者。


创始孟辰霖是DDIM、Img2Img、Model Distillation的作者。


这些方法,直接将扩散模型的推理速度提高了数百倍。也是GenAI editing方法的基石算法。


团队的研究科学家,Omer Bar-Tal,是谷歌CEO吹捧的AI视频大模型Lumiere项目的一作,有一线大模型训练的经验。




论文地址:https://arxiv.org/pdf/2401.12945



另外,Pika团队还拥有Hugging Face的Diffusers代码库的联创和最核心开发者。


Diffusers是Hugging Face最大的项目之一,训练GenAI模型的Default Library,现已拥有超过23k星。



顾问团队


此外,这家体量虽小的初创公司,还有着非常强大的顾问团队。



斯坦福AI实验室的主任,NLP大师Christopher Manning,是将深度学习应用于自然语言处理(NLP)的早期领导者之一。


Manning还是ACM院士、AAAI院士和ACL院士。截至目前,他个人被引数近25万,成为NLP领域引用量第一人。



两届奥斯卡得主,斯坦度大学工程学院的Canon教授Ron Fedkiw,曾参与制作了很多著名电影,比如加勒比海盗、星球大战的技术特效。



Fedkiw一直以来专注于计算机图形学的研究,曾设计了一个平台,首次应用在《终结者3:机器的崛起》中的T-X角色,现已被用来创造电影节最先进的特效。



Fedkiw的技术帮助《加勒比海盗2》获得了第79届奥斯卡最佳视觉效果奖


他个人在计算物理、图形学、机器学习和视觉方面,发表了140+篇论文,并出版了一本名为「Level Set Methods and Dynamic lmplicit Surfaces」的计算图形学书籍。



斯坦福大学计算机科学系的教授Stefano Ermon,在机器学习领域发表300+篇论文。并在扩散模型研究领域发表过著名的Score Matching以及「Denoising Diffusion Implicit Models」。



近期,Pika荣幸被选为福布斯Top AI 50公司,与Abridge、Harvey、Mistral并称为四个「New and Noteworthy」公司之一。同时,Business Insider将其评为Top 44最值得工作的创业公司。



5月初的时候,郭文景还被被彭博社评选为The People in Tech to Watch。



灵活的架构,「超神」的速度


除了坐拥阵容如此豪华的团队,Pika成功的另一个秘诀,就是快到令对手完全反应不过来的速度!


去年年初,AI视频领域早已在硅谷红了大半边天。


以Gen-2为代表的背后初创Runway成为当时最具竞争力、最受欢迎的公司,并坐拥100+员工,是估值1.5B美元的独角兽。


彼时,Pika还未诞生。


如今,仅用一年的时间,Pika已经成为了Runway的最大竞争对手。



其实,Pika的速度,从它成立缘由的那一点「小火苗」,就可以窥见。


2023年初,郭文景和同学参加Runway的首届AI电影节时,发现Runway和Adobe Photoshop的工具并不好用。


2023年4月底,为了开发更好用的AI视频工具,让「每个人都能成为自己的视频导演」,郭文景决定从斯坦福退学,Pika由此诞生。


一次失败的参赛经历,却让一家估值近5亿美元的公司诞生,这不啻是一段传奇。



某天下午,天使投资人Friedman向团队提出了一个想法:在视频中嵌入文本。


凌晨3点,他收到了一条短信,告知这项功能已经准备就绪。


Friedman被团队的高效震惊了,立刻决定进行下一轮投资。



论文成果斐然


Pika的能力之所以可以不断迭代,完全是基于团队在研究领域取得的诸多成果。


Pika在全球范围内有超过20个研究合著者,来自清华姚班、北大、斯坦福、MIT、加州理工等顶尖高校以及科研机构。


Pika下一步计划是,将在今年晚些时候,发布文本到视频模型重大更新。


郭文景透露,包括支持生成更高质量、更长时间的视频(目前只能生成3秒的视频,不过用户可以在视频生成之后再延长)。


郭表示,「我们正在努力打造最佳的视频模型,同时也在打造一款真正服务于创造者的产品」。


AI电影,究竟还有多远


从创立的第一天起,Pika对于产品就是这样构想的——


成为一个帮助用户把「想法」做成「视频」的平台,因此,团队需要创造全新的模型,实现这个「将任何人的概念变为现实」的功能。


如何让每个人都能成为自己故事的导演?Pika决定从最底层构建产品,让整个过程更有趣、更有挑战,也更容易理解。



距离我们能从电影院看到一部AI电影,究竟还需要多久?


在电影制作人Paul Trillo看来,从孤立的剪辑到制作一种以故事形式运行的工具,并且能让观众在观看时不会脱离其中,还有一段路。


AI能让电影实现到某种程度,取决于它能在多大程度上,执行使用者的真实意图和愿景。



Pika希望自己的模型可以理解各种不同的输入,这无疑对模型的能力提出了很高的要求。


从某种意义上,OpenAI的Sora也采用了类似的根本性「拔高」。


Sora对世界上事物的物理运行方式,有着深刻的理解。这,就能让视频的主体能够直接做出正确的互动和反应。



而让AI视频更接近电影的另一个因素,就是长度。


如今,我们已经达到了用3到8秒的镜头所能讲述故事类型的极限,而更长时间的视频,则会开启我们讲述更复杂故事的能力。


不过,即使能生成60秒视频,也并不意味着AI能创作一部连贯的电影。


这也就意味着,如今的视频AI,还有许多潜在的全新方向可以开卷。



对此,制作人Trillo预测道:「或许两年后的模型会有极强的控制力,为电影制作人提供任何所需的细节」。


而Pika,无疑是该领域被寄托了最多希望的选手之一。


因为它强大的执行力,意味着很多可能。



短短一年时间里,Pika已经初始的3人公司,组建了世界级的研究人员和科学家团队,还集结了一批创作力爆棚的创作者。


难以想象,下一步他们将如何利用AI,推动视频生成领域的最前沿。


文章来源于“新智元”,作者“新智元”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/