ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
昆仑万维方汉:Sora之后,中国AI从业者还有机会吗?
8630点击    2024-03-12 10:53

大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。


随着大模型技术迎来颠覆性突破,新兴AI应用大量涌现,不断重塑着人类、机器与智能的关系。


在昆仑万维「天工一刻」系列栏目中,我们将邀请学术专家、行业领袖对大模型产业热点、技术创新、应用案例进行深度解读,同时分享转载优秀的大模型行业文章,以飨读者。


2024年2月,Sora横空出世,一举打破了整个AI行业对于大模型文生视频技术的想象天花板。在全球热议之中,有关Sora、AIGC、中美AI差距、以及整个时代的AI红利,成为了人们的焦点话题。


本文原刊于中国网。在文章中,昆仑万维董事长兼CEO 方汉分享了关于“Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?”等问题的思考。


2024年春节期间,由OpenAI发布的AI视频工具Sora就震撼了世界,其逼真的画面细节,以及远超同类水平的物理理解力、画面连贯性、主体稳定性,使得Sora瞬间引爆了全球。


首当其冲的是内容行业。


Sora一经发布,创意软件巨头Adobe股价应声暴跌7.41%,市值瞬间蒸发超百亿美元,创下500天内最大跌幅,网络上处处充斥着“插画师失业”“剪辑师失业”“作者失业”的焦虑气氛。


可另一方面,海量AI辅助创作的文案、图像、视频却又如雨后春笋般疯狂涌现:三天出版AI绘本、1小时速成AI有声书、一周手搓AI《西游记》……无数人通过AI辅助内容生成挖到了AIGC第一桶金。就在2月26日,CCTV-1正式开播了中国首部文生视频AI动画片——《千秋诗颂》。



图片来自:央视网


Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?面对OpenAI,中国AI从业者还有机会吗?


“AI不仅是一个技术密集型行业,更是一个资金密集型的行业,投入非常大。OpenAI有了五年以上的工程积累,让其他公司在追赶的时候非常吃力,而且它不开源。”昆仑万维董事长兼CEO方汉说。


“但是,任何先进的技术,想长久保守机密非常困难。技术一定会随着时间推进而加速普及。技术上的门槛和工程上的经验,很快会被抹平。”方汉补充道。



昆仑万维董事长兼CEO 方汉


在这场AI浪潮中,昆仑万维的角色无疑是特殊的。


与大量“拿着锤子找钉子”、业务难以落地的AI创业公司不同,作为一家业务覆盖全球一百多个国家和地区,全球平均月活跃用户近4亿,手握AGI与AIGC、信息分发、社交娱乐及游戏等大量应用场景的上市公司,昆仑万维有着足够多的“钉子”亟待被解决,也有足够多的数据、用户、资源、以及GPU。


2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,奠定了中国AI搜索鼻祖的地位。


可另一方面,无论是社交、音乐、游戏、还是内容平台,这些昆仑万维赖以生存的主营业务,正是受到AI冲击最大的赛道。


对于昆仑万维而言,AI不是一场口头的“转型”,而是一场“Go Big or Go Home”的存亡之战。


当创作门槛降低1倍,内容数量增加10倍


“我不认同Sora就是AGI(通用人工智能),Sora跟AGI没关系。但这是文生视频的重要节点,它把这条路跑通了。很快,视频生产的成本将会大幅降低。”方汉说。


在内容生产行业,有这么一条规律:如果内容制作门槛降低1倍,那么内容创作者的创作数量将会增加10倍。


这是一条被产业多次验证过的定律。以短视频举例,随着通信技术从3G、4G迈向5G,再配合上手机处理器、摄像头、以及OS、触摸屏等一系列的技术创新,视频拍摄的门槛不断降低,短视频内容行业迎来惊人的爆发。


“一旦把(视频制作)门槛降下来,全民都在创作视频,UGC内容创作平台上的海量内容就会把PGC平台给淹没”,方汉说。


同样的故事正在AIGC领域悄然上演。


200元一张的淘宝模特图变成了0.02元的AI生成图片;经过专业调校的AI有声书足以以假乱真;在小红书上买4.9元的AI壁纸,半年涨粉大几万;AI孙燕姿一度成为B站上的“流量密码”……


甚至就在最近,李一舟《每个人的人工智能课》一年内卖出约25万套、网红艺术家“曾bobi”被指使用AI作画冒充原创等事件,都从侧面证实了AI生成内容的火爆。


2024年1月5日,昆仑万维发布了公司全新使命——“实现通用人工智能(AGI),让每个人更好地塑造和表达自我。”



图片来源:“天工AI智能助手”APP生成


这其中,“塑造自我”指的是通过AI实现个性化的终身学习、“表达自我”指的则是通过AI把人类创作门槛降得足够低,让人们更充分地实现自我表达。


“此前做视频的成本太高了。Sora出现之后,所有传统视频工作流上的人都会受到比较大的冲击。而且对内容行业的冲击最大,包括短视频、广告、影视等等。”方汉判断道。


随着AI的发展,内容行业将首先重塑、随即UGC的内容生产量迎来大爆发、而且会有AI时代的新型创作平台涌现。


“AI时代的终极应用一定是免费的To C内容创作平台。谁能最先跑通这个商业模式,谁就是下一个Tiktok。”方汉说。


“SOTA红利”有多大?


一个困扰国内外几乎所有AI创业者的问题是,OpenAI似乎没有“边界”。


一直以来,OpenAI在AI文本领域始终“遥遥领先”。ChatGPT与GPT-4的推出让OpenAI在文本领域始终保持着SOTA地位,无人可出其右(SOTA,State of the art,常用于表示特定机器学习领域表现最好的模型或方法)。


在AI图像领域却不尽然。此前,Midjourney一直是OpenAI的有力竞争对手,谷歌Gemini更是直逼GPT-4V的领先地位。


这一直被外界认为是OpenAI的“边界”所在,也是各大创业公司的机会所在。


然而,Sora的推出让OpenAI绕过图像,一举夺下了AI视频的SOTA“圣杯”,再次向资本与看客强调了自身垄断性的领先地位,并通过“7万亿美元筹资AI芯片”计划赚足了人们的注意力。


SOTA带来的不仅是资源,还有对顶尖AI人才的吸引。


“OpenAI现在能招到硅谷最好的人。所有人都要先去试一把,然后再考虑其他公司。”方汉感叹地说。

方汉将这种在人才与资源上的垄断性地位概括为“SOTA红利期”。


SOTA红利期,指的是在核心技术或细分领域达到SOTA地位,从而能以近乎“收割”的姿态吃到最大的市场红利。


所有巨头都有过SOTA红利期,曾经最好的人才在微软、之后在谷歌、后来在Mata……如今在OpenAI。


没有人能永远SOTA,但永远有人成为SOTA。


当前,OpenAI凭借着在基础模型的突破性跃迁,吃下了全球最大的AI红利。


在昂贵的“烧钱运营”与密集的融资需求之间,OpenAI在短期内不能出现任何掉队的迹象,必须在几乎所有基础模型领域保持SOTA,才能坐稳“神坛”。


不过,OpenAI并非无所不能,人类历史上也没有任何一家企业能够永远保持高速发展。当前,在语音、图片、具身智能、小样本模型等算法领域,以及AI音乐、漫画、社交、自动驾驶等应用领域,还存在着大量空白生态位,等待着不同企业收获“垂类SOTA红利”。


大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。


当前,昆仑万维已经构建了AI大模型、AI搜索、AI音乐、AI Story、AI游戏几大业务矩阵:是国内模型技术与工程能力最强、布局最全面的人工智能大模型企业之一。


“作为一家中等体量的科技公司,我们入局大模型早,目前基座模型能够做到全国前五。但是,在AI音乐、AI漫画技术领域,我们一直是国内的SOTA。”方汉说。


当前,昆仑万维面向国内市场推出了“天工AI智能助手”APP,面向海外市场则手握AI漫画、AI音乐、AI游戏Club Koala等多款面向C端用户的AI产品。


虽然公司极少在国内宣传海外业务,但其在海外已经取得了不俗的成绩。2023年前三季度,昆仑万维海外业务收入占比84%,业务已覆盖全球100多个国家和地区,全球平均月活跃用户近4亿人。



昆仑万维自研AI游戏Club Koala


昆仑万维旗下的AI游戏Club Koala是一款加入了UGC体系的派对游戏,玩家可以在其中自由设计游戏地图、关卡、虚拟形象。最吸引人的是,玩家可以在游戏中与拥有“自我意识与记忆”的AI NPC角色互动。这些AI NPC通过Atom系统控制行为,各自拥有不同的性格、愿望、回忆。该款游戏将在今年3月面向海外市场推出Beta测试版本。在海外,昆仑万维依托旗下信息分发及元宇宙业务Opera原生浏览器AI助手Aria,推出了一系列前沿AI功能,帮助海外用户提高效率并释放创造力。Aria已在包括欧盟在内的180多个国家和地区上线,用户突破百万大关。


All in AGI与AIGC


在过去的一年里,昆仑万维的AI业务用“紧锣密鼓、如火如荼”来形容已经不足够了。


2023年4月,昆仑万维推出自研千亿级天工大模型;8月,昆仑万维推出国内第一款AI搜索引擎——天工AI搜索,成为国内AI搜索鼻祖;10月,开源天工Skywork-13B系列大模型;12月,发布AI Agent开发平台天工SkyAgents;2024年2月,发布新版MoE大模型“天工2.0”。


在此期间,昆仑万维的算法与产品都以周为单位飞速迭代,AI团队的规模迅速扩张到近千人规模,办公楼里人满为患,大半数会议室都被改成了工位,产研团队的楼层时常半夜里仍灯火通明,“每天都有新人入职”。


这种强烈的紧迫感一方面源自大模型技术的日新月异,另一方面也源自对行业的判断。


“2024年,大模型的窗口期就会关闭。如果做不到,就会出局。2025年行业格局会变得非常清楚。最大的变量就在2024年。”——在一次公司内部分享会中,昆仑万维创始人周亚辉曾经这样说过。


当前,基础模型赛道越来越“卷”,准入门槛也越来越高。正如前文所言,AI是一个资金密集型的行业,企业的前期投入非常大。当前,亿元投资、千卡储备,都只能勉强摸到基础模型的门边。在这个算力比黄金还要昂贵的时代,没有提前入局的企业,在GPU全球紧缺的大背景下,拿着钱都买不到卡。


昆仑万维是属于最早入局的那一批。


在23年Q3财报中,昆仑万维透露,截至季度末,公司此前采购及租赁芯片已到货约6000张,另外还有约 3000 张芯片待交付;同时,公司已投资了AI算力芯片公司北京艾捷科芯,完成“算力基础设施—大模型算法—AI 应用”全产业链布局。


除了产品团队、研发团队、算力储备的不断扩张外,2023年期间,昆仑万维武汉建立起了一个庞大的数据团队;并力邀AI知名学者颜水成教授加入,创建了总部位于新加坡的2050全球研究院。


对于昆仑万维而言,“All in AGI与AIGC”,做基于大模型的UGC平台,这是一场必须打赢的战役。


“后GPT时代”


从Transformer、到Stable Diffusion、到RAG与MoE;从ChatGPT、到LLaMa、到Midjourney与Sora。在人类历史上,科技从未像今天这样,以一种令人眼花缭乱的速度刷新着个人认知,颠覆着每个行业。


最近在硅谷,一个称呼悄然流行——“后GPT时代(Post-GPT World)”。


后GPT时代,代表着人类对AI技术的探索、审视与反思;代表着人机关系底层逻辑的颠覆与重塑;也代表着新一代生产力的崛起。


也许,它还将代表着文明与冲突的范式发生改变。


在风靡全球的科幻作品《星际迷航》中,作者构建了这样一个世界,在遥远的未来,爱好和平的人类同众多外星种族一同战胜疾病、种族差异、贫穷、偏执与战争。跨越种族的生物通过万能翻译器相互交流与理解,人们携手探索宇宙,再弱小的文明也能够守护住自己的语言、文化与信仰。


“AIGC内容算法跑通、内容创作门槛降低之后,小众文化可能会更容易守住自己的信仰。”方汉说:“以前小语种是很难有自己文化传承的,因为创作者的人数少导致内容产能不够,慢慢就会被遗忘。但是AIGC内容创作工具出现之后,内容生产力迎来质的改变,少量创作者也可以用自己的语言、自己的文化去创造大量内容。我想看制作精良的电影大片,不会只能看英文的,我可以选择我自己文化的内容。”


文章来自于 36氪“昆仑万维”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api

3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

7
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/