马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型
8741点击    2025-03-18 21:17

马斯克也要打造自己的视频生成模型了??


就在最近,xAI收购了一家视频生成初创公司,这家仅4个人的公司过去两年打造出了Hotshot这款产品。



马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


据公告介绍,Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。


一看这架势,网友们纷纷想起了老马在今年1月的一场直播活动中掷下的豪言:


预计将在几个月内发布Grok视频模型


而且就在Hotshot联创&CEO公布上述消息之后,老马也第一时间跑来卖关子:


酷炫视频AI即将到来!


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


期待值被拉满的同时,众人也齐刷刷表达了对Hotshot团队的祝贺:


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


那么,这是一家怎样的团队呢?为什么它能被马斯克“看上”?


答案这就揭晓——


4人团两年打造“Sora”


概括而言,Hotshot之所以能入老马的眼,原因显然在于两方面:


一是“小团队也有大能量”,据悉Hotshot团队一共只有4个人,但他们在13个月里连续训练出了3个视频生成模型,且获得了一定程度的用户关注;二是虽然成立不久,但投资者中不乏Reddit联合创始人Alexis Ohanian等大佬


从Hotshot官网公布的信息来看,这个4人小团队在两年时间里成功打造出了“Sora”模型。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


4人中有两位是联合创始人。


联创&CEO Aakash Sastry(右边),和另一位联创&CTO John Mullan(左边)早在2012年就相识了。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


认识之前,前者正在构建一个视频聊天应用,后者正在尝试打造视觉通讯应用(visual communication apps)。


不过,在看到Aakash Sastry的视频聊天应用失败之后(本以为是很酷的想法,结果可能因为理念超前,大家很害怕视频通话),两人一致意识到:


我们需要创造一个让人们在网上表达自己的同时,也感到舒适和自由的环境。


于是,Hotshot逐渐诞生了。


2017年,两人共同成立了一家公司——Natural Synthetics(Hotshot背后公司),开始构建各种不同的社交应用。


到了2023年1月,他们正式在iOS应用商店发布了Hotshot。


不过需要注意,Hotshot一开始并不是做AI视频生成,而是图片生成


基于开源的图片生成模型Stable Diffusion,Hotshot为用户免费提供个人、朋友甚至是名人的图片。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

△两位创始人在Hotshot应用中创建的图片


直到后来逐渐被视频生成吸引,因此他们又开始训练视频生成模型。


和之前类似,一开始他们也打算基于开源模型构建,不过后面意识到:1)基础模型需要大幅改进;2)为了自由构建引人入胜的用户体验,需要对底层模型拥有控制权。


于是,他们正式决定自研视频模型


在过去的13个月里,他们训练了3个不同的视频模型:


  • 第一个Hotshot-XL:耗时3个月开发,每秒生成8帧视频,开源后至今每月约有2万名新的开发者和艺术家使用;


  • 第二个Hotshot Act-One:耗时5个月开发,生成3秒8fps的视频,基于2亿个公开视频训练而成;


  • 第三个Hotshot:耗时4个月开发,生成最长10秒的720p视频,限文生视频。


按照Hotshot发布时的说法,在各种提示评估中,70%的情况下用户更喜欢Hotshot的结果,而不是其他开源文生视频模型。


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


另外,从CEO Aakash Sastry公布的消息来看,Hotshot的投资者包括Stripe前高管Lachy Groom、Reddit联合创始人Alexis Ohanian以及SV Angel在内的风险投资机构。


至于具体融资次数和规模,Hotshot尚未公开披露,而且也不清楚整个Hotshot团队是否会集体加入xAI


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


马斯克想开发自己的视频生成模型?


事实上,早在今年1月,马斯克在一场直播活动中就透露了自研视频生成模型的想法:


(指路原推文视频15:02)


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型


对于自家的Grok模型一直没有视频生成功能这事儿,老马本人和用户都不太满意。


而要解决这个问题,通常来说有两条路可走:


要么直接接入其他家模型,要么自研。


从Grok之前的一些倾向来看,他们主要选择第一种方案,比如其Grok-2的文生图功能,就是通过与此前备受瞩目的Flux深度融合实现。


然而现在,老马明显转向了。


为了和OpenAI、谷歌等展开长期竞争,xAI最终也是走上了自研之路,开始通过收购进一步布局。


不过不管怎样,对于我们普通用户来说,期待Grok的视频生成功能就完事了!


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型



参考链接:

[1]https://x.com/aakashsastry/status/1901668601364689338

[2]https://hotshot.co/



文章来自微信公众号 “ 量子位 ”,作者 一水


马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型

关键词: Hotshot , AI视频 , 视频模型 , xAI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales