ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
刚刚,今年最大3D大模型融资来了
3751点击    2024-09-19 09:36



3D大模型公司VAST完成亿元级融资。


又一个清华系AI,达晨、春华、绿洲都投了。


从前两年的百模大战,到如今诸多互联网大厂纷纷躬身入局,大语言模型赛道竞争之激烈可想而知。而在这场较量、角逐中,无数细分垂类赛道也跃跃欲试,3D基础模型则正是其中之一。


投中网近日获悉,3D大模型公司VAST在一年内,先后完成数亿元天使轮及Pre-A轮融资。并创造了3D大模型赛道的最大融资金额。天使轮领投方为绿洲资本,Pre-A轮领投方为达晨财智以及春华创投,英诺天使基金、水木清华校友种子基金跟投。


在过去一年里,3D大模型赛道涌现了诸多玩家。5月,a16z 宣布以500万美元领投3D角色生成公司Yellow,还投资了Kaedim和CSM等其他3D模型公司。7月,Meta发布了其文生3D模型技术Meta 3D Gen,能够在1分钟内生成高质量3D内容。这些发展标志着3D大模型技术的快速进步与广泛应用。


文字、图片、视频、3D、声音等不同载体是AIGC的各个分支,VAST成立于2023年3月。CEO宋亚宸表示,VAST通过3D大模型Tripo,致力于构建一个全民内容平台,将3D空间作为用户表达的重要方式。


本轮VAST所筹资金将主要⽤于技术研发及团队扩张、深⼊推动产品商业化发展、进⼀步扩⼤⼤规模算⼒中台、强化⽣态合作等。


发现蓝海,杀出重围


VAST的初衷并非打造一家大模型公司,而是基于长期兴趣和文化背景,捕捉到一个尚未被充分开发的机会。他们发现,文字、图片、视频、声音和3D等都是信息表达的载体,但唯有3D还没有发展出自己的UGC(用户生成内容)平台。


过去,内容平台在移动互联网时代被多次验证为成功模式,比如抖音、快手、小红书、微博和知乎等。而如果未来能够出现一个3D版的抖音,用户可以在其中体验丰富的游戏化内容并进行互动,这无疑是一个巨大的商业机会。


VAST在探索3D内容社区的过程中虽然面临了一些挑战,但这也促使团队积极寻找解决方案。由于3D创作的门槛和成本较高,早期经历了用户增长缓慢的阶段。


制作一个高质量的3D内容,往往需要动用数百人,耗费数年时间,且花费巨大。宋亚宸认为,生成3D内容的难度类似于拍摄电影、撰写长篇小说,甚至像是米开朗基罗的画作,属于“精英艺术”的范畴,普通用户难以涉足。


这让他意识到,要实现真正的大众化3D内容平台,必须先解决工具问题,降低创作门槛。正如其他内容媒介从精英艺术转向大众创作的过程一样,3D内容也需要经历类似的转变。


首先,3D创作属于精英艺术;接下来,需要开发出大众级别的创作工具,降低创作成本并加快反馈速度;最终,才有可能催生一个内容丰富、种类多样的UGC平台。换句话说,VAST的目标是通过提供易用的3D创作工具,降低内容生产门槛,丰富内容生态,从而逐步积累起创作者、消费者和开发者,最终实现构建一个面向大众的3D内容平台的梦想。


有了清晰的目标,VAST针对性的进行技术研发。2024年初,VAST推出了基于千万级3D高质量原生数据库训练的大模型Tripo 1.0,该模型允许用户在8秒内通过单图或文字生成3D网格模型。上线半年内,全球用户已生成超过500万个3D模型,几乎相当于当前全球前三大3D模型交易网站的总和。


近期,VAST发布了Tripo 2.0,通过融合DiT和U-Net模型的新架构,显著提升了3D模型的几何形状和材质输出质量。在全球匿名测试中,Tripo 2.0的生成效果始终保持领先,宋亚宸称其表现已达到Midjourney V4的水平,展现出巨大商业化潜力。


VAST的技术应用主要覆盖四个场景:传统CG行业,如游戏、动画、虚拟制作和影视;传统互联网领域,如电商、教育、直播和社交;3D打印工业设计,包括鞋服、家居、首饰、食品等;以及新兴行业,如元宇宙、数字孪生、具身智能、仿真模拟和数字人,而这些场景的拓展为大众提供了虚拟制作能力。


成立一年多,VAST已初步发展了300多家客户,包括与全球家用3D打印机龙头企业合作,以及拓竹的Markerworld和Anycubic旗下的Makeronline等平台的上线。


相较于文本和图像,3D内容的人工生产成本要高得多,因此用AI取代人工进行3D建模,能显著降低成本。当被问及现有技术是否足够满足艺术家和创作者的需求时,宋亚宸认为大模型会不断迭代,VAST的Tripo 2.0预计在年底达到V5水平。


他相信,随着3D从精英艺术向大众表达媒介的转变,将形成一个万亿美金的市场,尽管这一过程需要时间和工具的持续迭代。当前,VAST在全球竞争中已经崭露头角,并展现出强劲的增长势头,其未来的长期优势值得期待和关注。


出海,当然要更高的商业化天花板


VAST的创始人兼CEO是宋亚宸,本科毕业于约翰霍普⾦斯⼤学,曾在商汤科技负责AIGC技术在动画及游戏等项目的实际落地,后来也曾参与创立AI独角兽MiniMax。


2022年底,宋亚宸创立VAST时原以为融资会很顺利,但由于经济寒冬和风投对尚无明确趋势的项目持观望态度,融资遇到困难。尽管他接触了六七家财务顾问,却未能成功融资。因此,宋亚宸决定暂时搁置融资,专注于组建团队并推动业务发展。


首席技术官梁鼎,清华大学本硕博,发表过50余篇论文及拥有100多项专利,累计引用近万次。曾任商汤科技通⽤模型负责⼈,在人工智能领域探索十余年。


首席科学家曹炎培,清华大学本科及博士,曾在腾讯ARC实验室和人工智能实验室领导⽣成式3D⼯作。师从胡事民院士,有超过70篇学术论⽂和创新成果,曾联合创立3D全息公司Owlii,后被快⼿收购。


到了2024年初,Sora横空出世引发资市场对多模态大模型的关注,VAST也借势快速完成了Pre-A轮融资。


达晨在内容生成方面已经布局了大语言模型、文生图、文生视频等,而文生/图生3D是“新文明”拼图的最后一环。正如“AI教母”李飞飞的观点,人类是生活在3D世界中的,而人工智能要真正追上人类,必须突破3D的理解和生成,而面向C端的3D创作工具就成为了关键环节、重中之重。


相比较VAST在2B方向对于传统建模师的帮助,达晨更看好其在2C方向对于广大消费者生活方式的改变。试想一下,大到房屋家具、小到鞋包杯碗,身边的物品都可以按照自己的心意来设计和制造,个性化将得到极大解放,每个人心中的创意都将得以展现。如果再配合上MR眼镜,可以随时随地改造世界,在下一代互联网中共享空间文明。


春华创投负责人邹凌表示,3D动画和游戏蕴藏着千亿级市场势能,然而目前却受限于生成效率和成本,这种错位很快将被人工智能技术改变。VAST拥有明星技术团队,管理层积累了全周期的技术创业经验。公司已经结合技术优势和内容平台,形成数据飞轮。


宋亚宸认为,VAST在融资过程中的核心竞争力主要体现在三个方面。


首先,团队从创业早期就确定了数据驱动的重要性,积累了2000万高质量3D数据,领先竞争对手1至2个数量级,这一前瞻性策略使其在数据资源上具备显著优势;


其次,团队不断探索3D的最佳表达方式,通过寻找更好的token,实现高保真、高还原和高压缩能力,从而更有效地结合3D模型数据与大模型进行训练;


最后,VAST凭借早期在3D模型生成领域的卡位优势,吸引了全球顶尖的研究人才,建立了千人规模的科学家网络,确保技术路径和前沿研究的统一。这些因素使得VAST在竞争中占据了领先地位。


在与投资者的接触中,宋亚宸发现中美资方对3D生成模型的态度存在显著差异。美国投资机构如a16z等积极投资了Luma、Yellow和CSM等多家3D大模型公司,认为游戏、社交和元宇宙是AI的关键应用场景;而在中国,具身智能和AI陪伴类应用被视为更具市场潜力。这种差异促使VAST从一开始就立足于全球市场。

在宋亚宸看来,传统视频拍摄是由神创造了一个世界,人选择位置和角度进行录制,而虚拟制作则是由人创造一个世界并进行拍摄。随着3D大模型技术的成熟,未来的视频中将有更多内容通过虚拟制作生成,从而对视频行业带来深远的冲击。这种技术的发展将显著拓展视频创作的可能性,推动行业进入新的发展阶段。


文章来自于微信公众号“东四十条资本”,作者“刘燕秋”


关键词: VAST , AI融资 , AI 3D , Tripo , 3D基础模型
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
AI 3D建模

【开源免费】LGM是一个AI建模的项目,它可以将你上传的平面图片,变成一个3D的模型。

项目地址:https://github.com/3DTopia/LGM?tab=readme-ov-file

在线使用:https://replicate.com/camenduru/lgm

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales