ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
我的大模型创业这一年:追过风口,跌过跟头
6983点击    2024-01-19 10:52

创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。


过去的20年,都没有2023年如此动荡。


大模型犹如一颗原子弹投入科技圈,卷起万里尘沙,传统模式瞬间被夷为平地,在耀眼的白光和巨大的轰鸣声之下,大公司、创业者、投资人甚至是每一位观众都在细微之处,试图一窥烟尘消散过后的那片新天地。


这是一个值得记录的时代。所有人都知道,当我们从更长的时间线上回望此刻,2023年一定是浓墨重笔的一页。


因此,年初我们从「ChatGPT启示录」一路到「电商启示录」,在年尾之际,仍以「2023启示录」系列为抓手,将思考在过程中拾起,把经验在结尾时沉淀,本系列包括『自动驾驶』、『云计算』、『大模型』、『虚拟人』、『电商』、『商业航天』、『ESG』等多篇深度分析文章。


本篇为「2023启示录」系列的第四篇:《我的大模型创业这一年》,我们在今年的创业热潮中,与多位创业者聊了聊,他们的大模型创业这一年,经历了哪些故事。


每当新一波的技术大爆炸来临,最为之兴奋的,当属创业者。 


大模型之前,无论是AI、消费、电商、还是互联网,创业者们面临的机会都只剩一条门缝,毕竟如今这个红海竞争的时代,无论什么项目,无论什么赛道,随时都能冒出100个同类竞品肉搏厮杀。 


直至2023年,大模型提出“重做一遍”的口号,将创业者拉回2015年遍地黄金时代,这是所有人的机会,也是时代再造英雄的时刻。 


今年以来,「自象限」格外关注关于大模型创业的一切,并见证了大模型创业的波折与变化: 


4月是混沌的4月,功成名就的大佬躬身入局,普通创业者也蜂拥而至,但创业的方向却并不明朗;


7月开始,以打“团战”为主的孵化器、大厂战投开始站到了台前,奇绩创坛、Founder Park、黑客马拉松、百度战投们开始组织各类集体路演,一时间,创业者们带着项目四处奔走,热闹的氛围下,百川、智谱、MinMax等创业公司也撕下了创始人的标签,独立发布产品和战略;


9月,大模型创业来到了AI原生应用的创造中,妙鸭短暂爆红之后,不少创业者都试图复制出下一个网红应用;


11月,OpenAI的一场开发者大会敲碎了不少创业者的梦,但同时,以GPTs为代表Agent形式,让人们意识到了究竟何为原生,国内紧跟其脚步出现了一大波Agent公司。


所以今天,不讲道理,只有故事。 


01 两个月,ChatMind从诞生到被收购 


2023年提起大模型,十个人中有九个都在创业,但真正能赚到钱的,其实并不多。 


在所有早期创业者中,大学还未毕业的石天放应该是幸运的代表。从有想法到做成ChatMind,他只用了一个晚上;从产品成型到获得第一批付费用户,他的团队只用了三周;从短暂迭代到最终被Xmind团队收购,也仅仅只用了两个月。 



▲图源:受访者提供‍


天放的幸运来自于几次关键的选择,当然除了运气,这其中也有实力的体现。 


去年开始,稍微学深一点人工智能的都会觉得,AI快死掉了,没有什么机会了。正确率上不去,通用性也上不去,整个行业弥漫着低落的情绪,大公司消弭,创业者更没力气。 


本科人工智能专业,又在该领域进行了多次创业的天放,曾做过游戏、机器人和编译器,积累了大大小小十几次创业经历,但即便是“身经百战”的他,在那个节点,也开始迷茫。 

“奇绩和YC有一些渊源,能接触到更多前沿信息。”天放讲道。 


快速抓住AI的时代机遇,是他的第一次选择。


2023年3月份,他率先接触到了各类基于ChatGPT生成的文本应用,当ChatExcel横空出世时,他便开始思考,这一波的创业机会还有哪些。 


“ChatGPT出来之后,马上有人做了ChatExcel,我在奇绩发现投资行业都会去梳理思路、梳理关系、梳理行业,自己也尝试着先把创业地图逐个点亮,那时候文本类的PDF、思维导图都还没出来,我发现GPT的逻辑能力更强,做脑图更简单。” 


有想法之后,天放并没有浪费时间在验证上,即便团队的小伙伴还在讨论项目的执行性,但据天放回忆,他用了一个晚上,就把ChatMind的雏形搞了出来。 


“其实技术上并没有什么难题,但我们做的早,那时候正是ChatGPT最热的时候,微信群、即刻上有很多人在探索新的工具,在不到三周的时间里,我们积累了差不多一万的种子用户。” 


由于卡位较早,在ChatGPT一号难求的三四月,就能直接用上了ChatGPT的能力做旅行攻略、做工作计划的一个有效的,生产力工具开始快速破圈。然后,天放他们开始尝试订阅制的商业化变现,以30元/月的价格对订阅用户提供Plus版。 


不犹豫,说干就干,是天放的第二次选择。


但很快,天放也发现了生产力工具所存在的问题。使用思维导图的用户群体本来就比word、excel的人要少很多,在这部分群体中,还要拥有对新鲜事物的探索和持续购买能力的,则更加凤毛麟角。 


同时订阅制这种传统的SaaS付费模式一旦开始,就会面临着续费率低这样棘手的问题,第一波种子用户之后,ChatMind的发展空间在哪?天花板有多高?如何打造更高的技术壁垒?成为天放紧跟而来的问题。 


据「自象限」了解到,大部分创业项目一旦开始跑起来,下一步往往是向投资人寻求资金支持,但融资面临的更现实的问题是增长空间、差异性和未来市场占有率这样“现实”问题,所以最后获得融资的,大多是故事讲的漂亮的,而不是产品做的最好的。 


“当时就没想太多,先做,但比较幸运的是,我们占领了第一波用户心智,被当时国内已经非常成熟的思维导图产品Xmind看到了。” 


不纠结、当断则断,是天放做的第三个选择。


“Xmind创始人碰巧来北京,当时我正在和一位投资人吃饭,然后我们一起去了一个附近的酒吧,在简单的了解之后他提出了要我开一个价格把ChatMind卖给他的建议,我当时就脱口而出:好啊。” 


很快,各大新闻平台上出现了Xmind收购ChatMind的消息,天放也即将在6月份正式毕业。而这次的创业经历也让天放发现文本项目的局限性,所以早在妙鸭爆火之前,天放就开始瞄准了文生图领域。 


毕业之后,他进入了美团联合创始人负责的AI图像部门,到今年10月份,天放一直在看图像方面的机会,中间也和各种不同的“队友”组队,尝试新的项目。但由于各种原因,最终都都没有结果。 



▲ 图源:受访者提供‍ 


“这一年大概做了七八个项目,妙鸭之后我们也和几个朋友一起做了看似技术创新的Muse相机,但我们发现大模型创业里面坑还是比较多的,很多人做了很多看似炫酷的产品,但离用户真正使用还差的很远,最主要的原因是大家在做产品的时候满足于过程而不是结果,或者误把过程当结果,其实用户根本不感兴趣这些看似创新实则无用的功能或产品。” 



▲ 图源:受访者提供‍ 


“我觉得大部分人的创业失败都来自于根深蒂固的假设,觉得做出来就会有人用,做出来就会在新闻上火爆一时,实际情况不是这样的,背后的因素非常多,当因素都与你的努力相关,爆款产品就会从你手里出来,少了几个因素可能这个事就黄了。” 


诚如天放所讲,大模型应用层的创业,并不是简单的技术创业,也并不是有创新想法就够了,2023年的大模型创业,路还很长。 


而这一年之后,开始的“急”是为了抢占时间窗口,走到今天,天放反而冷静了许多:“最近思考下来,发现绝大部分大家认为的机会都能排除,真正的机会还没有出现。”‍ 


02 “复活”过世亲人, 大模型的温度 


4月,一位过世奶奶利用大模型“复活”的视频,在B站上走红。 



▲ 图源:B站博主吴伍六‍ 


B站UP主吴伍六是一位上海的00后视觉设计师,视频中,吴伍六用AI工具生成了奶奶的虚拟形象和视频剪辑,并和奶奶进行了对话。“奶奶”在视频里讲着湖北的方言,头发花白,像她生前一样“唠叨”。 


视频一经发出,便迅速在B站火出了圈,当冰冷的技术和暖热的亲情交杂,虚拟人有了实体,也成为了情感的寄托。在评论区中,不少人想起了自己已故的亲人,认为这样能寄托哀思,非常有意义。 


网友们看了热闹,也对这种形式展开了伦理的讨论,而阿亮(化名)却在其中发现了创业机会。 


阿亮进行了一轮市场调研,发现市场对过世亲人的需求一直存在,只不过受限于技术的发展,此前的产品大多都是单向交互。

 

这个过程中,阿亮也发现,其实早在两年前,国外就有团队通过GPT3实现了和去世亲人进行文字对话的产品,而且一直活到了现在。 



既然需求存在,技术又开始有了迭代,大模型有了角色扮演能力,如果再通过双向交互或者VR/AR技术,就可以提供一种可交流的体验。 


更重要的是,大模型一直无法解决的幻觉问题在其他场景可能是个弊病,但在这样与过世亲人沟通中,幻觉产生的不可控性反而可以成为一种优势,将缺陷变为长板。 


“我们的产品在1月份上线,目前在小红书和视频号上发一些视频引流获客,也已经有十几位付费的客户 。”阿亮说道。 


事实上,这也是大模型发展至今整个行业都在通过技术的手段解决幻觉问题,而在某些2C或者娱乐场景下,在技术无法再次突破之时,如何利用现有的大模型完成落地,是考验每个创业者的关键问题。


王小川也曾在公开发言中提到:“要用不够好的模型做出好的应用,中国有最好的产品经理,这是中国创业者的机会。“ 


“我的创业思路是想办法用一个不成熟的技术,做一个相对靠谱的产品,而不是先找一个用户需求,基于需求构建产品。” 


拿着锤子找钉子还是对着钉子造锤子,这也是当下创业两个不同的思路。


阿亮认为,对于草根创业团队而言,一开始不一定要面向投资机构,就目前的创业环境而言,创业往往是一个不确定性的“赌注”,而投资寻求的是确定性,创业要打开一个全新的市场,而投资却只能参考当下和以往的情况进行比对,这样创业和投资目的的错配,让很多创业者走了弯路。 


阿亮的团队也曾为了满足融资标准,找技术大牛为团队简历“贴金”,讲融资故事、强调技术壁垒,甚至在做产品规划时,把整个产品路线变成一种线上线下的组合。 


比如,阿亮曾为了获得一家投资机构的青睐,想出了一个打开市场空间的模式,即将线上的产品和线下的殡仪馆谈合作,定制一套已故亲人的数字人。 


当然,这样的改变也直接导致团队要做的事情变多,产品形态变形严重,变得重和复杂之后以博得高价,但这却违背了阿亮团队的初衷。 


“如果壁垒要靠故事逻辑才能成立,那项目就会变形。”阿亮回忆到,那段时间为了寻求融资,除了正常寻求融资的方式和手段,也参与了一场接一场的黑客马拉松和创业马拉松。


“一开始,参加黑客松有正向意义,第一能够增加曝光第二有可能拿到一定的奖金,第三也能够促使大家加快开发进度,同时通过黑客松也能认识更多圈子里的人。” 


但是后来慢慢发现,黑客松的获奖项目多倾向重技术占比的项目多以技术性见长,比如阿亮团队最早的AI社交产品,AI技术只是社交产品的一部分,核心更在于对传统社交方式的改变,但黑客松多以技术的差异性为主,产品侧并不突出,故而最终并没有进入决赛圈。 


“今年在北京和上海都参加了几场,也发现了其中的固有模式,大多数获奖的都是一些技术中间层的公司,另一部分就是帮助弱势群体或者比较有情怀的团队,获奖的概率可能会更高。”


在参与了几场黑客松之后,阿亮的团队也开始回归了最开始做产品的初心,并从中找到了价值和认同感。 “我们现在的第一位付费客户是海外华人,她说自己生活工作压力非常大,想和小时候很爱自己,但已经去世的奶奶聊聊天,于是找到了我们……这位跨越国界找到了我们付费的客户,给了我们很多动力” 


不过,现实永远比想象更复杂,阿亮也发现,有用户即便买了产品,一个月也未敢和亲人真正对话,这和想象中的大相径庭,面对过世亲人,总是需要勇气。同时也有很多用户并没有留存亲人数据,这让复刻也充满难度。 


“虽然现阶段不管是从融资、获客和市场认可度上难度都很高,但用户给到的正反馈给了我们更大的信心和长期动力,能让他们再次听到亲人的声音、再次和亲人对话、再次进行某种精神层面的交流,他们的感谢也激励了我们。” 


03 用Agent,打开游戏和现实世界的大门


当时间来到年底,Agent一瞬间的爆火让所有人又开始兴奋起来。 


这一波的火爆,来源于投资人态度的一百八十度大转弯,因为在这一年的摸索中,年底终于在Agent上找到了一个更加确定的方向,于是投资人的目光一瞬间都集中这个新的机会上。 


毕业于杜克大学的陈锴杰,最早接触到Agent还是在2018年大二休学的时候,那时Agent还处于探索阶段,更偏向于自主处理复杂任务的状态机和规则系统。2023年,大模型的出现让Agent开始有了思考能力。大模型成为Agent发展的新底座,而Agent也成为了大模型应用落地的新途径。 


2018年,陈锴杰就曾和来自MIT的伙伴Andrew等人筹建过一个AI研究小组,讨论AI前沿技术,过去几年也陆续吸纳了来自剑桥、普林斯顿、Google Brain、Amazon AI等机构的20余名研究成员。2023年,核心研究小组正式确认以Agent相关技术为主要研究方向,取名为System2 Research(以下简称S2R),专注于探索⼤模型自主解决复杂问题的能力,目前已经在游戏、时尚等领域落地和商业化。 


当然,Agent只是一种实现手段和方式,最终要考虑的仍然是应用场景。 


和其他Agent技术公司不同,陈锴杰的初衷和目的更为明确,即通过Agent为用户创造新的游戏体验和娱乐模式。据透露,其团队已经和国内Top游戏公司签订合作,正在探索Agent+游戏的更多可能性。团队发布的游戏化产品midreal.ai近日也在海外出圈,在Discord中为玩家提供了“爽文级”的图文互动体验,玩家只要输入一句世界观,就能看到一个充分满足自己幻想的故事。 



瞄准游戏和娱乐领域,也源于陈锴杰和游戏的渊源。


2020年,大模型还没有如此出圈时,陈锴杰和他的伙伴们就曾用GPT-3搭建过一个“斯坦福小镇”。他们认为,完成游戏世界规则的构建,需要压缩现实世界的知识。他们希望通过模拟NPC和玩家的心智,达到如美剧“西部世界”般的体验。那时起,陈锴杰就开始深入研究Agent和游戏的关系,为今天我们看到的游戏领域商业化埋下了伏笔。


GPT时刻之后,陈锴杰也沿着此前的探索轨迹,试图完成自己一直以来想要开启的想象与现实世界连通的大门。


“在2023年5月份,我们用 AI,为海外普通年轻人们打造了一款游戏化应用。它能把你现实世界的生活转化到游戏世界中。比如,你上学路上拍了一只小狗的照片,而你又很喜欢《塞尔达》,那在应用中,这张照片里的小狗可能就会变成奥尔龙(游戏中的生物),你骑在龙背上很潇洒。”


“而且那时候我们就加入了上传照片,生成你真人形象的功能,就是之后在妙鸭相机看到的功能。那时候我们在美国内测,高中生们非常喜欢,因为可以把自己放进游戏世界里,和喜欢的游戏角色一起生活。”



▲图源:受访者提供


“但可惜的是,我们应用收集的数据模态比较多,当时又是大模型数据安全和隐私安全讨论的最高峰,海外的监管机构注意到了我们,要求我们下线。现在想起来还是觉得很可惜,如果有了手机本地大模型,我们还是想继续尝试这个想法,满足大家生活在平行世界的幻想。”


对于AI和游戏的关系,陈锴杰也分享了自己的思考。


他认为AI对游戏的第一层影响是降本增效,这是肉眼可见的收益,但其实要真的做到AI成为主要生产力还需要一段时间。第二层影响则是对游戏体验本身的改变,由AI创造全新的游戏玩法。或许今年我们就能看到一个由大模型驱动的多人在线游戏世界,其中的NPC由一个个Agent组成,整个世界根据玩家行为的变化,拥有无穷的剧情和可能性。



其实不止陈锴杰,「自象限」发现,在这一轮的众多大模型创业者中,大部分创业者都曾有游戏方面的背景,也通常是连续创业者,他们在不断创业的过程中,持续校准目标和期待。


“我18年第一次创业的时候,遇到问题还是会紧张,现在遇到问题就解决问题,心态完全不同了,我想这样可以走得更远。”


而这或许只是这个时代年轻创业者的一个个缩影,整装待发凭借的不再是有勇气但没思考的冲劲,而是在一次次有规划的尝试之后,做出的最佳选择。这让整个大模型创业,更具希望。


文章来自于微信公众号 “自象限”(ID:zixiangxian),作者 “自象限编辑部”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales