# 热门搜索 #
搜索
昆仑万维方汉:Sora之后,中国AI从业者还有机会吗?
8507点击    2024-03-12 10:53

大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。


随着大模型技术迎来颠覆性突破,新兴AI应用大量涌现,不断重塑着人类、机器与智能的关系。


在昆仑万维「天工一刻」系列栏目中,我们将邀请学术专家、行业领袖对大模型产业热点、技术创新、应用案例进行深度解读,同时分享转载优秀的大模型行业文章,以飨读者。


2024年2月,Sora横空出世,一举打破了整个AI行业对于大模型文生视频技术的想象天花板。在全球热议之中,有关Sora、AIGC、中美AI差距、以及整个时代的AI红利,成为了人们的焦点话题。


本文原刊于中国网。在文章中,昆仑万维董事长兼CEO 方汉分享了关于“Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?”等问题的思考。


2024年春节期间,由OpenAI发布的AI视频工具Sora就震撼了世界,其逼真的画面细节,以及远超同类水平的物理理解力、画面连贯性、主体稳定性,使得Sora瞬间引爆了全球。


首当其冲的是内容行业。


Sora一经发布,创意软件巨头Adobe股价应声暴跌7.41%,市值瞬间蒸发超百亿美元,创下500天内最大跌幅,网络上处处充斥着“插画师失业”“剪辑师失业”“作者失业”的焦虑气氛。


可另一方面,海量AI辅助创作的文案、图像、视频却又如雨后春笋般疯狂涌现:三天出版AI绘本、1小时速成AI有声书、一周手搓AI《西游记》……无数人通过AI辅助内容生成挖到了AIGC第一桶金。就在2月26日,CCTV-1正式开播了中国首部文生视频AI动画片——《千秋诗颂》。



图片来自:央视网


Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?面对OpenAI,中国AI从业者还有机会吗?


“AI不仅是一个技术密集型行业,更是一个资金密集型的行业,投入非常大。OpenAI有了五年以上的工程积累,让其他公司在追赶的时候非常吃力,而且它不开源。”昆仑万维董事长兼CEO方汉说。


“但是,任何先进的技术,想长久保守机密非常困难。技术一定会随着时间推进而加速普及。技术上的门槛和工程上的经验,很快会被抹平。”方汉补充道。



昆仑万维董事长兼CEO 方汉


在这场AI浪潮中,昆仑万维的角色无疑是特殊的。


与大量“拿着锤子找钉子”、业务难以落地的AI创业公司不同,作为一家业务覆盖全球一百多个国家和地区,全球平均月活跃用户近4亿,手握AGI与AIGC、信息分发、社交娱乐及游戏等大量应用场景的上市公司,昆仑万维有着足够多的“钉子”亟待被解决,也有足够多的数据、用户、资源、以及GPU。


2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,奠定了中国AI搜索鼻祖的地位。


可另一方面,无论是社交、音乐、游戏、还是内容平台,这些昆仑万维赖以生存的主营业务,正是受到AI冲击最大的赛道。


对于昆仑万维而言,AI不是一场口头的“转型”,而是一场“Go Big or Go Home”的存亡之战。


当创作门槛降低1倍,内容数量增加10倍


“我不认同Sora就是AGI(通用人工智能),Sora跟AGI没关系。但这是文生视频的重要节点,它把这条路跑通了。很快,视频生产的成本将会大幅降低。”方汉说。


在内容生产行业,有这么一条规律:如果内容制作门槛降低1倍,那么内容创作者的创作数量将会增加10倍。


这是一条被产业多次验证过的定律。以短视频举例,随着通信技术从3G、4G迈向5G,再配合上手机处理器、摄像头、以及OS、触摸屏等一系列的技术创新,视频拍摄的门槛不断降低,短视频内容行业迎来惊人的爆发。


“一旦把(视频制作)门槛降下来,全民都在创作视频,UGC内容创作平台上的海量内容就会把PGC平台给淹没”,方汉说。


同样的故事正在AIGC领域悄然上演。


200元一张的淘宝模特图变成了0.02元的AI生成图片;经过专业调校的AI有声书足以以假乱真;在小红书上买4.9元的AI壁纸,半年涨粉大几万;AI孙燕姿一度成为B站上的“流量密码”……


甚至就在最近,李一舟《每个人的人工智能课》一年内卖出约25万套、网红艺术家“曾bobi”被指使用AI作画冒充原创等事件,都从侧面证实了AI生成内容的火爆。


2024年1月5日,昆仑万维发布了公司全新使命——“实现通用人工智能(AGI),让每个人更好地塑造和表达自我。”



图片来源:“天工AI智能助手”APP生成


这其中,“塑造自我”指的是通过AI实现个性化的终身学习、“表达自我”指的则是通过AI把人类创作门槛降得足够低,让人们更充分地实现自我表达。


“此前做视频的成本太高了。Sora出现之后,所有传统视频工作流上的人都会受到比较大的冲击。而且对内容行业的冲击最大,包括短视频、广告、影视等等。”方汉判断道。


随着AI的发展,内容行业将首先重塑、随即UGC的内容生产量迎来大爆发、而且会有AI时代的新型创作平台涌现。


“AI时代的终极应用一定是免费的To C内容创作平台。谁能最先跑通这个商业模式,谁就是下一个Tiktok。”方汉说。


“SOTA红利”有多大?


一个困扰国内外几乎所有AI创业者的问题是,OpenAI似乎没有“边界”。


一直以来,OpenAI在AI文本领域始终“遥遥领先”。ChatGPT与GPT-4的推出让OpenAI在文本领域始终保持着SOTA地位,无人可出其右(SOTA,State of the art,常用于表示特定机器学习领域表现最好的模型或方法)。


在AI图像领域却不尽然。此前,Midjourney一直是OpenAI的有力竞争对手,谷歌Gemini更是直逼GPT-4V的领先地位。


这一直被外界认为是OpenAI的“边界”所在,也是各大创业公司的机会所在。


然而,Sora的推出让OpenAI绕过图像,一举夺下了AI视频的SOTA“圣杯”,再次向资本与看客强调了自身垄断性的领先地位,并通过“7万亿美元筹资AI芯片”计划赚足了人们的注意力。


SOTA带来的不仅是资源,还有对顶尖AI人才的吸引。


“OpenAI现在能招到硅谷最好的人。所有人都要先去试一把,然后再考虑其他公司。”方汉感叹地说。

方汉将这种在人才与资源上的垄断性地位概括为“SOTA红利期”。


SOTA红利期,指的是在核心技术或细分领域达到SOTA地位,从而能以近乎“收割”的姿态吃到最大的市场红利。


所有巨头都有过SOTA红利期,曾经最好的人才在微软、之后在谷歌、后来在Mata……如今在OpenAI。


没有人能永远SOTA,但永远有人成为SOTA。


当前,OpenAI凭借着在基础模型的突破性跃迁,吃下了全球最大的AI红利。


在昂贵的“烧钱运营”与密集的融资需求之间,OpenAI在短期内不能出现任何掉队的迹象,必须在几乎所有基础模型领域保持SOTA,才能坐稳“神坛”。


不过,OpenAI并非无所不能,人类历史上也没有任何一家企业能够永远保持高速发展。当前,在语音、图片、具身智能、小样本模型等算法领域,以及AI音乐、漫画、社交、自动驾驶等应用领域,还存在着大量空白生态位,等待着不同企业收获“垂类SOTA红利”。


大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。


当前,昆仑万维已经构建了AI大模型、AI搜索、AI音乐、AI Story、AI游戏几大业务矩阵:是国内模型技术与工程能力最强、布局最全面的人工智能大模型企业之一。


“作为一家中等体量的科技公司,我们入局大模型早,目前基座模型能够做到全国前五。但是,在AI音乐、AI漫画技术领域,我们一直是国内的SOTA。”方汉说。


当前,昆仑万维面向国内市场推出了“天工AI智能助手”APP,面向海外市场则手握AI漫画、AI音乐、AI游戏Club Koala等多款面向C端用户的AI产品。


虽然公司极少在国内宣传海外业务,但其在海外已经取得了不俗的成绩。2023年前三季度,昆仑万维海外业务收入占比84%,业务已覆盖全球100多个国家和地区,全球平均月活跃用户近4亿人。



昆仑万维自研AI游戏Club Koala


昆仑万维旗下的AI游戏Club Koala是一款加入了UGC体系的派对游戏,玩家可以在其中自由设计游戏地图、关卡、虚拟形象。最吸引人的是,玩家可以在游戏中与拥有“自我意识与记忆”的AI NPC角色互动。这些AI NPC通过Atom系统控制行为,各自拥有不同的性格、愿望、回忆。该款游戏将在今年3月面向海外市场推出Beta测试版本。在海外,昆仑万维依托旗下信息分发及元宇宙业务Opera原生浏览器AI助手Aria,推出了一系列前沿AI功能,帮助海外用户提高效率并释放创造力。Aria已在包括欧盟在内的180多个国家和地区上线,用户突破百万大关。


All in AGI与AIGC


在过去的一年里,昆仑万维的AI业务用“紧锣密鼓、如火如荼”来形容已经不足够了。


2023年4月,昆仑万维推出自研千亿级天工大模型;8月,昆仑万维推出国内第一款AI搜索引擎——天工AI搜索,成为国内AI搜索鼻祖;10月,开源天工Skywork-13B系列大模型;12月,发布AI Agent开发平台天工SkyAgents;2024年2月,发布新版MoE大模型“天工2.0”。


在此期间,昆仑万维的算法与产品都以周为单位飞速迭代,AI团队的规模迅速扩张到近千人规模,办公楼里人满为患,大半数会议室都被改成了工位,产研团队的楼层时常半夜里仍灯火通明,“每天都有新人入职”。


这种强烈的紧迫感一方面源自大模型技术的日新月异,另一方面也源自对行业的判断。


“2024年,大模型的窗口期就会关闭。如果做不到,就会出局。2025年行业格局会变得非常清楚。最大的变量就在2024年。”——在一次公司内部分享会中,昆仑万维创始人周亚辉曾经这样说过。


当前,基础模型赛道越来越“卷”,准入门槛也越来越高。正如前文所言,AI是一个资金密集型的行业,企业的前期投入非常大。当前,亿元投资、千卡储备,都只能勉强摸到基础模型的门边。在这个算力比黄金还要昂贵的时代,没有提前入局的企业,在GPU全球紧缺的大背景下,拿着钱都买不到卡。


昆仑万维是属于最早入局的那一批。


在23年Q3财报中,昆仑万维透露,截至季度末,公司此前采购及租赁芯片已到货约6000张,另外还有约 3000 张芯片待交付;同时,公司已投资了AI算力芯片公司北京艾捷科芯,完成“算力基础设施—大模型算法—AI 应用”全产业链布局。


除了产品团队、研发团队、算力储备的不断扩张外,2023年期间,昆仑万维武汉建立起了一个庞大的数据团队;并力邀AI知名学者颜水成教授加入,创建了总部位于新加坡的2050全球研究院。


对于昆仑万维而言,“All in AGI与AIGC”,做基于大模型的UGC平台,这是一场必须打赢的战役。


“后GPT时代”


从Transformer、到Stable Diffusion、到RAG与MoE;从ChatGPT、到LLaMa、到Midjourney与Sora。在人类历史上,科技从未像今天这样,以一种令人眼花缭乱的速度刷新着个人认知,颠覆着每个行业。


最近在硅谷,一个称呼悄然流行——“后GPT时代(Post-GPT World)”。


后GPT时代,代表着人类对AI技术的探索、审视与反思;代表着人机关系底层逻辑的颠覆与重塑;也代表着新一代生产力的崛起。


也许,它还将代表着文明与冲突的范式发生改变。


在风靡全球的科幻作品《星际迷航》中,作者构建了这样一个世界,在遥远的未来,爱好和平的人类同众多外星种族一同战胜疾病、种族差异、贫穷、偏执与战争。跨越种族的生物通过万能翻译器相互交流与理解,人们携手探索宇宙,再弱小的文明也能够守护住自己的语言、文化与信仰。


“AIGC内容算法跑通、内容创作门槛降低之后,小众文化可能会更容易守住自己的信仰。”方汉说:“以前小语种是很难有自己文化传承的,因为创作者的人数少导致内容产能不够,慢慢就会被遗忘。但是AIGC内容创作工具出现之后,内容生产力迎来质的改变,少量创作者也可以用自己的语言、自己的文化去创造大量内容。我想看制作精良的电影大片,不会只能看英文的,我可以选择我自己文化的内容。”


文章来自于 36氪“昆仑万维”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api

3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

7
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/