创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。
过去的20年,都没有2023年如此动荡。
大模型犹如一颗原子弹投入科技圈,卷起万里尘沙,传统模式瞬间被夷为平地,在耀眼的白光和巨大的轰鸣声之下,大公司、创业者、投资人甚至是每一位观众都在细微之处,试图一窥烟尘消散过后的那片新天地。
这是一个值得记录的时代。所有人都知道,当我们从更长的时间线上回望此刻,2023年一定是浓墨重笔的一页。
因此,年初我们从「ChatGPT启示录」一路到「电商启示录」,在年尾之际,仍以「2023启示录」系列为抓手,将思考在过程中拾起,把经验在结尾时沉淀,本系列包括『自动驾驶』、『云计算』、『大模型』、『虚拟人』、『电商』、『商业航天』、『ESG』等多篇深度分析文章。
本篇为「2023启示录」系列的第四篇:《我的大模型创业这一年》,我们在今年的创业热潮中,与多位创业者聊了聊,他们的大模型创业这一年,经历了哪些故事。
每当新一波的技术大爆炸来临,最为之兴奋的,当属创业者。
大模型之前,无论是AI、消费、电商、还是互联网,创业者们面临的机会都只剩一条门缝,毕竟如今这个红海竞争的时代,无论什么项目,无论什么赛道,随时都能冒出100个同类竞品肉搏厮杀。
直至2023年,大模型提出“重做一遍”的口号,将创业者拉回2015年遍地黄金时代,这是所有人的机会,也是时代再造英雄的时刻。
今年以来,「自象限」格外关注关于大模型创业的一切,并见证了大模型创业的波折与变化:
4月是混沌的4月,功成名就的大佬躬身入局,普通创业者也蜂拥而至,但创业的方向却并不明朗;
7月开始,以打“团战”为主的孵化器、大厂战投开始站到了台前,奇绩创坛、Founder Park、黑客马拉松、百度战投们开始组织各类集体路演,一时间,创业者们带着项目四处奔走,热闹的氛围下,百川、智谱、MinMax等创业公司也撕下了创始人的标签,独立发布产品和战略;
9月,大模型创业来到了AI原生应用的创造中,妙鸭短暂爆红之后,不少创业者都试图复制出下一个网红应用;
11月,OpenAI的一场开发者大会敲碎了不少创业者的梦,但同时,以GPTs为代表Agent形式,让人们意识到了究竟何为原生,国内紧跟其脚步出现了一大波Agent公司。
所以今天,不讲道理,只有故事。
2023年提起大模型,十个人中有九个都在创业,但真正能赚到钱的,其实并不多。
在所有早期创业者中,大学还未毕业的石天放应该是幸运的代表。从有想法到做成ChatMind,他只用了一个晚上;从产品成型到获得第一批付费用户,他的团队只用了三周;从短暂迭代到最终被Xmind团队收购,也仅仅只用了两个月。
▲图源:受访者提供
天放的幸运来自于几次关键的选择,当然除了运气,这其中也有实力的体现。
去年开始,稍微学深一点人工智能的都会觉得,AI快死掉了,没有什么机会了。正确率上不去,通用性也上不去,整个行业弥漫着低落的情绪,大公司消弭,创业者更没力气。
本科人工智能专业,又在该领域进行了多次创业的天放,曾做过游戏、机器人和编译器,积累了大大小小十几次创业经历,但即便是“身经百战”的他,在那个节点,也开始迷茫。
“奇绩和YC有一些渊源,能接触到更多前沿信息。”天放讲道。
快速抓住AI的时代机遇,是他的第一次选择。
2023年3月份,他率先接触到了各类基于ChatGPT生成的文本应用,当ChatExcel横空出世时,他便开始思考,这一波的创业机会还有哪些。
“ChatGPT出来之后,马上有人做了ChatExcel,我在奇绩发现投资行业都会去梳理思路、梳理关系、梳理行业,自己也尝试着先把创业地图逐个点亮,那时候文本类的PDF、思维导图都还没出来,我发现GPT的逻辑能力更强,做脑图更简单。”
有想法之后,天放并没有浪费时间在验证上,即便团队的小伙伴还在讨论项目的执行性,但据天放回忆,他用了一个晚上,就把ChatMind的雏形搞了出来。
“其实技术上并没有什么难题,但我们做的早,那时候正是ChatGPT最热的时候,微信群、即刻上有很多人在探索新的工具,在不到三周的时间里,我们积累了差不多一万的种子用户。”
由于卡位较早,在ChatGPT一号难求的三四月,就能直接用上了ChatGPT的能力做旅行攻略、做工作计划的一个有效的,生产力工具开始快速破圈。然后,天放他们开始尝试订阅制的商业化变现,以30元/月的价格对订阅用户提供Plus版。
不犹豫,说干就干,是天放的第二次选择。
但很快,天放也发现了生产力工具所存在的问题。使用思维导图的用户群体本来就比word、excel的人要少很多,在这部分群体中,还要拥有对新鲜事物的探索和持续购买能力的,则更加凤毛麟角。
同时订阅制这种传统的SaaS付费模式一旦开始,就会面临着续费率低这样棘手的问题,第一波种子用户之后,ChatMind的发展空间在哪?天花板有多高?如何打造更高的技术壁垒?成为天放紧跟而来的问题。
据「自象限」了解到,大部分创业项目一旦开始跑起来,下一步往往是向投资人寻求资金支持,但融资面临的更现实的问题是增长空间、差异性和未来市场占有率这样“现实”问题,所以最后获得融资的,大多是故事讲的漂亮的,而不是产品做的最好的。
“当时就没想太多,先做,但比较幸运的是,我们占领了第一波用户心智,被当时国内已经非常成熟的思维导图产品Xmind看到了。”
不纠结、当断则断,是天放做的第三个选择。
“Xmind创始人碰巧来北京,当时我正在和一位投资人吃饭,然后我们一起去了一个附近的酒吧,在简单的了解之后他提出了要我开一个价格把ChatMind卖给他的建议,我当时就脱口而出:好啊。”
很快,各大新闻平台上出现了Xmind收购ChatMind的消息,天放也即将在6月份正式毕业。而这次的创业经历也让天放发现文本项目的局限性,所以早在妙鸭爆火之前,天放就开始瞄准了文生图领域。
毕业之后,他进入了美团联合创始人负责的AI图像部门,到今年10月份,天放一直在看图像方面的机会,中间也和各种不同的“队友”组队,尝试新的项目。但由于各种原因,最终都都没有结果。
▲ 图源:受访者提供
“这一年大概做了七八个项目,妙鸭之后我们也和几个朋友一起做了看似技术创新的Muse相机,但我们发现大模型创业里面坑还是比较多的,很多人做了很多看似炫酷的产品,但离用户真正使用还差的很远,最主要的原因是大家在做产品的时候满足于过程而不是结果,或者误把过程当结果,其实用户根本不感兴趣这些看似创新实则无用的功能或产品。”
▲ 图源:受访者提供
“我觉得大部分人的创业失败都来自于根深蒂固的假设,觉得做出来就会有人用,做出来就会在新闻上火爆一时,实际情况不是这样的,背后的因素非常多,当因素都与你的努力相关,爆款产品就会从你手里出来,少了几个因素可能这个事就黄了。”
诚如天放所讲,大模型应用层的创业,并不是简单的技术创业,也并不是有创新想法就够了,2023年的大模型创业,路还很长。
而这一年之后,开始的“急”是为了抢占时间窗口,走到今天,天放反而冷静了许多:“最近思考下来,发现绝大部分大家认为的机会都能排除,真正的机会还没有出现。”
4月,一位过世奶奶利用大模型“复活”的视频,在B站上走红。
▲ 图源:B站博主吴伍六
B站UP主吴伍六是一位上海的00后视觉设计师,视频中,吴伍六用AI工具生成了奶奶的虚拟形象和视频剪辑,并和奶奶进行了对话。“奶奶”在视频里讲着湖北的方言,头发花白,像她生前一样“唠叨”。
视频一经发出,便迅速在B站火出了圈,当冰冷的技术和暖热的亲情交杂,虚拟人有了实体,也成为了情感的寄托。在评论区中,不少人想起了自己已故的亲人,认为这样能寄托哀思,非常有意义。
网友们看了热闹,也对这种形式展开了伦理的讨论,而阿亮(化名)却在其中发现了创业机会。
阿亮进行了一轮市场调研,发现市场对过世亲人的需求一直存在,只不过受限于技术的发展,此前的产品大多都是单向交互。
这个过程中,阿亮也发现,其实早在两年前,国外就有团队通过GPT3实现了和去世亲人进行文字对话的产品,而且一直活到了现在。
既然需求存在,技术又开始有了迭代,大模型有了角色扮演能力,如果再通过双向交互或者VR/AR技术,就可以提供一种可交流的体验。
更重要的是,大模型一直无法解决的幻觉问题在其他场景可能是个弊病,但在这样与过世亲人沟通中,幻觉产生的不可控性反而可以成为一种优势,将缺陷变为长板。
“我们的产品在1月份上线,目前在小红书和视频号上发一些视频引流获客,也已经有十几位付费的客户 。”阿亮说道。
事实上,这也是大模型发展至今整个行业都在通过技术的手段解决幻觉问题,而在某些2C或者娱乐场景下,在技术无法再次突破之时,如何利用现有的大模型完成落地,是考验每个创业者的关键问题。
王小川也曾在公开发言中提到:“要用不够好的模型做出好的应用,中国有最好的产品经理,这是中国创业者的机会。“
“我的创业思路是想办法用一个不成熟的技术,做一个相对靠谱的产品,而不是先找一个用户需求,基于需求构建产品。”
拿着锤子找钉子还是对着钉子造锤子,这也是当下创业两个不同的思路。
阿亮认为,对于草根创业团队而言,一开始不一定要面向投资机构,就目前的创业环境而言,创业往往是一个不确定性的“赌注”,而投资寻求的是确定性,创业要打开一个全新的市场,而投资却只能参考当下和以往的情况进行比对,这样创业和投资目的的错配,让很多创业者走了弯路。
阿亮的团队也曾为了满足融资标准,找技术大牛为团队简历“贴金”,讲融资故事、强调技术壁垒,甚至在做产品规划时,把整个产品路线变成一种线上线下的组合。
比如,阿亮曾为了获得一家投资机构的青睐,想出了一个打开市场空间的模式,即将线上的产品和线下的殡仪馆谈合作,定制一套已故亲人的数字人。
当然,这样的改变也直接导致团队要做的事情变多,产品形态变形严重,变得重和复杂之后以博得高价,但这却违背了阿亮团队的初衷。
“如果壁垒要靠故事逻辑才能成立,那项目就会变形。”阿亮回忆到,那段时间为了寻求融资,除了正常寻求融资的方式和手段,也参与了一场接一场的黑客马拉松和创业马拉松。
“一开始,参加黑客松有正向意义,第一能够增加曝光第二有可能拿到一定的奖金,第三也能够促使大家加快开发进度,同时通过黑客松也能认识更多圈子里的人。”
但是后来慢慢发现,黑客松的获奖项目多倾向重技术占比的项目多以技术性见长,比如阿亮团队最早的AI社交产品,AI技术只是社交产品的一部分,核心更在于对传统社交方式的改变,但黑客松多以技术的差异性为主,产品侧并不突出,故而最终并没有进入决赛圈。
“今年在北京和上海都参加了几场,也发现了其中的固有模式,大多数获奖的都是一些技术中间层的公司,另一部分就是帮助弱势群体或者比较有情怀的团队,获奖的概率可能会更高。”
在参与了几场黑客松之后,阿亮的团队也开始回归了最开始做产品的初心,并从中找到了价值和认同感。 “我们现在的第一位付费客户是海外华人,她说自己生活工作压力非常大,想和小时候很爱自己,但已经去世的奶奶聊聊天,于是找到了我们……这位跨越国界找到了我们付费的客户,给了我们很多动力”
不过,现实永远比想象更复杂,阿亮也发现,有用户即便买了产品,一个月也未敢和亲人真正对话,这和想象中的大相径庭,面对过世亲人,总是需要勇气。同时也有很多用户并没有留存亲人数据,这让复刻也充满难度。
“虽然现阶段不管是从融资、获客和市场认可度上难度都很高,但用户给到的正反馈给了我们更大的信心和长期动力,能让他们再次听到亲人的声音、再次和亲人对话、再次进行某种精神层面的交流,他们的感谢也激励了我们。”
当时间来到年底,Agent一瞬间的爆火让所有人又开始兴奋起来。
这一波的火爆,来源于投资人态度的一百八十度大转弯,因为在这一年的摸索中,年底终于在Agent上找到了一个更加确定的方向,于是投资人的目光一瞬间都集中这个新的机会上。
毕业于杜克大学的陈锴杰,最早接触到Agent还是在2018年大二休学的时候,那时Agent还处于探索阶段,更偏向于自主处理复杂任务的状态机和规则系统。2023年,大模型的出现让Agent开始有了思考能力。大模型成为Agent发展的新底座,而Agent也成为了大模型应用落地的新途径。
2018年,陈锴杰就曾和来自MIT的伙伴Andrew等人筹建过一个AI研究小组,讨论AI前沿技术,过去几年也陆续吸纳了来自剑桥、普林斯顿、Google Brain、Amazon AI等机构的20余名研究成员。2023年,核心研究小组正式确认以Agent相关技术为主要研究方向,取名为System2 Research(以下简称S2R),专注于探索⼤模型自主解决复杂问题的能力,目前已经在游戏、时尚等领域落地和商业化。
当然,Agent只是一种实现手段和方式,最终要考虑的仍然是应用场景。
和其他Agent技术公司不同,陈锴杰的初衷和目的更为明确,即通过Agent为用户创造新的游戏体验和娱乐模式。据透露,其团队已经和国内Top游戏公司签订合作,正在探索Agent+游戏的更多可能性。团队发布的游戏化产品midreal.ai近日也在海外出圈,在Discord中为玩家提供了“爽文级”的图文互动体验,玩家只要输入一句世界观,就能看到一个充分满足自己幻想的故事。
瞄准游戏和娱乐领域,也源于陈锴杰和游戏的渊源。
2020年,大模型还没有如此出圈时,陈锴杰和他的伙伴们就曾用GPT-3搭建过一个“斯坦福小镇”。他们认为,完成游戏世界规则的构建,需要压缩现实世界的知识。他们希望通过模拟NPC和玩家的心智,达到如美剧“西部世界”般的体验。那时起,陈锴杰就开始深入研究Agent和游戏的关系,为今天我们看到的游戏领域商业化埋下了伏笔。
GPT时刻之后,陈锴杰也沿着此前的探索轨迹,试图完成自己一直以来想要开启的想象与现实世界连通的大门。
“在2023年5月份,我们用 AI,为海外普通年轻人们打造了一款游戏化应用。它能把你现实世界的生活转化到游戏世界中。比如,你上学路上拍了一只小狗的照片,而你又很喜欢《塞尔达》,那在应用中,这张照片里的小狗可能就会变成奥尔龙(游戏中的生物),你骑在龙背上很潇洒。”
“而且那时候我们就加入了上传照片,生成你真人形象的功能,就是之后在妙鸭相机看到的功能。那时候我们在美国内测,高中生们非常喜欢,因为可以把自己放进游戏世界里,和喜欢的游戏角色一起生活。”
▲图源:受访者提供
“但可惜的是,我们应用收集的数据模态比较多,当时又是大模型数据安全和隐私安全讨论的最高峰,海外的监管机构注意到了我们,要求我们下线。现在想起来还是觉得很可惜,如果有了手机本地大模型,我们还是想继续尝试这个想法,满足大家生活在平行世界的幻想。”
对于AI和游戏的关系,陈锴杰也分享了自己的思考。
他认为AI对游戏的第一层影响是降本增效,这是肉眼可见的收益,但其实要真的做到AI成为主要生产力还需要一段时间。第二层影响则是对游戏体验本身的改变,由AI创造全新的游戏玩法。或许今年我们就能看到一个由大模型驱动的多人在线游戏世界,其中的NPC由一个个Agent组成,整个世界根据玩家行为的变化,拥有无穷的剧情和可能性。
其实不止陈锴杰,「自象限」发现,在这一轮的众多大模型创业者中,大部分创业者都曾有游戏方面的背景,也通常是连续创业者,他们在不断创业的过程中,持续校准目标和期待。
“我18年第一次创业的时候,遇到问题还是会紧张,现在遇到问题就解决问题,心态完全不同了,我想这样可以走得更远。”
而这或许只是这个时代年轻创业者的一个个缩影,整装待发凭借的不再是有勇气但没思考的冲劲,而是在一次次有规划的尝试之后,做出的最佳选择。这让整个大模型创业,更具希望。
文章来自于微信公众号 “自象限”(ID:zixiangxian),作者 “自象限编辑部”
【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目
项目地址:https://github.com/weijunext/smart-excel-ai
在线使用:https://www.smartexcel.cc/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales