ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
FP 研究:AI 应用创业的壁垒在哪里?如何构建?
3840点击    2024-05-10 09:44

进入 2024 年,AGI 领域的投融资热度明显下降。


当模型层的技术边界仍未清晰界定,全球 AI 相关的流量红利开始逐渐消解,而一些 PMF 发生在了大厂,大厂追赶创业公司的时间周期缩短到数周时,对于创业者而言,快速构建自己的业务壁垒就更为关键。这同样也是 AGI 领域投资人不得不思考的难题。

围绕这个问题,我们也邀请了四位投资人朋友,进行了针对性的解读。


01. 于红 美团龙珠合伙人
02. 刘大卫 Capital O 创始合伙人
03. 邵旭辉 Foothill Ventures 管理合伙人
04. 宋春雨 联想创投合伙人


Founders Summary

从他们的分享中,我们不难看出:


1. 当前,AGI 领域存在一些普遍的投资难题。如,模型快速迭代消解创业公司的生存空间、创业公司快速动态调整自己的业务往往与投资时的 BP 相去甚远、目前看到的项目普遍都达不到上市并有回报的可能性、优秀的 AI-Native 创业者稀缺等。基于这样的环境背景,投人仍是这个阶段主要的投资逻辑。


2. 对于创业者而言,筹集到足够多、足够健康的现金流,尽可能更久地留在牌桌上,才有可能成为最后的赢家。一个共识是,在模型层不成熟的情况下,今天大部分 AI 应用很可能都是过渡状态的应用。在这个过程中,积累经验、数据、早期用户都变得日益重要。


3.非明星创业者与明星创业者的融资策略不同。非明星创业者很可能需要想办法另辟蹊径,体现自己的优势。Foothill 的管理合伙人邵旭辉认为,要精确定位一个狭窄的垂类,让自己成为这个垂类的“明星”,用扎实的科研和相关调研来说服投资人;用实际行动来证明市场。Captial O 创始合伙人刘大卫认为,在共识的方向上发现非共识并挖掘价值,同时快速试错快速迭代。

01


核心观点:


1. 在我们看来,第一阶段要考虑的是 model prodcut fit(MPF),PMF 是第二阶段才要考虑的事情。


2. AI 领域的创业者需要很强的 AI 模型应用能力。模型的能力分成三方面:理性能力、情感能力、知识能力。目前来看,模型的知识能力和情感能力表现都还不错。但是在理性能力方面还比较弱,尤其是逻辑推理能力。


3. 在 Character.ai 中,用户与 Character 大多会以角色扮演的形式去推动剧情和做幻想的情感交流,所以在 AI 游戏中,场景的丰富性、游戏中的可控性都会影响用户留存。


Q1:2024 年,你关注最多的一个 AI 的产品/公司是什么?你觉得它最打动你的地方在哪里?


于红:其实我从 2023 年到现在一直都比较关注 AI 游戏这个方向,我会把Character.ai 和病娇女友这样的产品统称为 AI 游戏。这两个产品都体现了用户不同维度的兴趣。以 Character.ai 为例,我们很关心用户在长达 2 个小时的互动时间内跟 Character 到底交互了一些什么样的内容。


我们也做了用户调研,用户调研显示,用户跟 Character 会以角色扮演的形式去推动剧情和做幻想的情感交流,只有很小一部分会去交流自己的日常生活。我们认为,对于这部分用户来说,用户在 Character 的体验是非常类似于游戏的。我们希望长期观察到产品的泛化能力,对于 Character.AI 和病娇女友来说,场景的丰富性、游戏中的可控性都非常重要,这些最终都会体现在用户留存中。


Q2:2024 年,你思考最多的一个 AI 相关的问题是什么?为什么思考这个问题,最近有什么一些结论?


于红:我思考最多的问题是模型的边界,比如模型有哪些功能,以及如何把这些功能独立拆分出来。到目前为止,我们的拆分还是相对粗糙的。比如我们把模型的能力分成三方面:理性能力、情感能力、知识能力。目前来看,模型的知识能力普遍表现地很出色,情感能力也还不错。通过适当的训练和调整,AI能以更恰当的风格进行表达。但是在理性能力方面,尤其逻辑推理能力,目前还比较弱。


为什么要思考这些问题呢?一个好的大模型产品需要发挥其优势并避免劣势。这些问题可以为我们提供方向,帮助我们思考什么样的产品方向更适合当前这一代AI,以便让 AI 能够发挥更大的价值。


Q3:如果投 AI 相关公司,会重点投什么轮次和阶段?你的投资标准里包括了哪些必备条件?2024 年,国内下半年 AI 领域的投资可能会呈现哪些特点?


于红:我们投资的阶段不限。从公司的早期种子轮、天使轮,一直可以支持到公司 Pre-IPO 轮。

我的投资标准是希望创业者志存高远,做的事情未来有机会给中国和世界带来正向影响。创始人要非常 Visionary,有想要改变世界的动机。


2023 年,投资人主要在投资大模型基座,我认为 2024 年大家会以投资应用为主。然而,我们也能明显观察到,投资人普遍对 AI 应用持半怀疑态度。尽管如此,我们也非常坚定的看好 AI 应用的未来,甚至包括那些最初以大模型基座形式出现的公司。长期来看,我们将从应用的角度对这些公司进行重新评估。


Q4:如果投 AI 相关公司,最看重哪些创业者的特质?


于红:创业成功对所有创业者而言都是一项艰巨的挑战,而 AI 领域的创业者除了需要具备其他成功创业者的特质外,还需要很强的AI模型应用能力


创始人或者创始团队成员最好需要具备熟练用模型、玩模型的能力(Prompt Engineering),了解模型的能力边界,并了解模型在不同场景下的优劣势;对于特别的场景,需要对技术有更高的要求,比如用好开源模型,能做很好的SFT, Continued training;更高的要求是对于技术发展的前瞻性有一定的预判或者认知,能够持续不断地跟踪模型技术的能力进展,这对于应用层公司选择在工程层面优化哪些能力,在模型层面等待基础模型的提高是非常有价值的(避免模型能力一提高,之前的很多工作就白费了;要做到模型能力提高以后,产品会更加好用。)


这些要求之所以关键,是因为今天的大模型不是全能的,不能实现全部的设想。在移动互联网时代,创业者普遍在找 product market fit(PMF)。今天在我们看来 PMF 应该是第二阶段要考虑的事情,第一阶段要考虑的事情是 model prodcut fit(MPF),在创始人想要打造的产品上,如何利用模型的优势,同时规避模型的短板。因此,创始人或创始团队成员需要对模型的应用能力有着深刻的理解。


Q5:对于 AI 领域的明星创业者有哪些建议?对于AI领域的非明星创业者有哪些建议?


于红:一件事情的特点往往就是它的优点,但同时也具备了相应的缺点。明星创业者拥有更多的经验,尤其是对当年移动互联网产品的经验,以及对商业模式的理解,对公司发展节奏的把握等等。


如何让这些经验不成为包袱?这是明星创业者最需要克服的问题。我的建议是:尽可能深入理解大模型的底层技术,并且尽可能的去多玩多用,甚至是亲自上手去训练这些模型。


而对于年轻创业者来说,他们往往有更多的创意,玩模型的能力较强、对大模型底层的技术创新理解得更多,但是在如何打造一个具备竞争力的产品、对商业模式的理解、对公司发展节奏的把握,是需要补课的。在这方面我的建议是:可以多和成功的创业者以及有经验的投资人沟通。


Q6:这几年最打动你的一个创业者是谁?他有哪些特质打动你?


于红:最打动我的创始人是 Musical.ly 的联合创始人 Alex Zhu。他定义了今天短视频的交互模式,其中最重要的两个创新点是:第一,视频采用全屏展示,这在当时是一个创新,因为此前的视频甚至图片都不是全屏的。第二,引入了上滑下滑的交互方式,这在移动互联网时代是一个重大的交互创新。


更为重要的是,Alex 对社区型产品有着底层的深刻认知。在当年我们投资的时候,他就有讲到一个社区运营的 philosophy,是指社区的运营和人类社会的发展规律是类似的。建立一个影响者社区的过程在很多方面与从零开始建设一个新国家的经济相似。


早期阶段,创建一个社区就像是发现一片新大陆,比如美国。面临的挑战是如何增加人口、吸引移民,并将这片土地建设成一个繁荣的经济体。在 Alex Zhu 的比喻中,Musical.ly 代表美国,而 YouTube 和 Instagram 则代表欧洲。要说服已经在欧洲站稳脚跟的创作者迁移到美国,需要提供一个他们无法抗拒的价值提案。在欧洲,社会阶层已经固化,普通创作者向上流动的机会几乎为零。Musical.ly 看到了这一点,并利用它作为吸引创作者的机会。


平台需要在早期建立一个集中的经济体系,这意味着资源和财富在少数人手中积累,确保他们能够成功建立观众群和财富,成为国家和平台的榜样,类似创造一个“美国梦”。随着欧洲的普通创作者看到普通人在美国成为超级富翁的故事,他们开始思考自己是否也能实现同样的成功,这促使许多人迁移到你的平台。然而,仅仅创造一个梦想是不够的,同时需要建立一个可以让每个人都有机会的经济体系。这意味着要分散流量模式,为所有用户创造满足感,建立一个中产阶级。这平台不仅能够吸引顶尖创作者,也能够持续地吸引和保留广大用户群体。这个节奏顺序不能错了,比如说一开始聚集了大量的内容创作者, 但是并没有足够的用户基础。这些内容创作者无法获得有效的正反馈,那他们可能就会离开这个平台。

02


核心观点:


1.动手能力强、生态型、社群型的创业者,非常适合做现在的AI创业。


2.应用层的社群价值现阶段比技术价值更加珍贵。


3.应用层真正大规模繁荣,并出现上亿 DAU 体量的规模性平台应用的时间点大概率会在 1-2 年之后。


Q1:2024 年,你思考最多的一个AI相关的问题是什么?为什么思考这个问题,最近有什么一些结论?


刘大卫:我最近在思考适合 VC 股权投资的机会在哪里?


当前 VC 在模型层的投资过程中普遍遇到了几个问题:


目前底层模型还处在爬坡期,迭代速度快,周期短,但资源消耗大,当技术的新路径出现或经历大的迭代之后,应用层公司之前积累的基于上一代技术架构的先发优势可能就失去价值了。


我们与海外的优秀工程师交流后,基本持相同观点,底层大模型在未来 2-3 年内都会持续爬坡,也就是说模型能力会越来越强,开发工具会越来越完善,推理和训练成本会越来越低。因此应用层的繁荣,可能还需要 1-2 年时间。


即便如此,我们现阶段仍在积极地寻找应用层的投资机会。投资行为与市场繁荣并不一定在同一时间发生,同时我们认为在这个领域可能都是红海,没有蓝海机会。在之前的互联网时代,创业公司在大厂入场前通常有 6-12 个月的时间窗口期,但如今的 AI 时代,留给创业公司的时间窗口期大大缩短,可能只有两三周。比如 Kera AI 在 LCM 开源之后的一周内就发布了自己的产品。

团队下场越早,越能更早的积累实战经验,等机会真正出现的时候能快速抓住机会。


过去一年,我们的合伙人 Aaron Qian 在应用者开发前线花费了大量的时间,得出一些结论:应用层现阶段存在百万用户体量的现金流业务机会,但尝鲜用户体量有限,AI 原生应用难以出圈,导致天花板较低,项目不一定具有长期股权价值,目前缺乏平台性规模性机会。


我们观察到有很多具有较强市场洞察力的团队,在小的切入口找到与用户的强连接点,从而迅速蹿红。同时这样的团队通常不大,在 10-15 人左右的规模就可以很快做到几百万美金 ARR 的规模。从团队现金流的角度来说非常健康,但网络效应在当下还很难实现,这类公司在向更大体量发展,向更小白用户拓圈的过程中仍面临很大挑战。目前看来基于 LLM 的技术更多是锦上添花的赋能(enabler),真正出现AI原生的颠覆型(disruptor)机会,还需要耐心等待技术从量变到质变的跃迁点。

我们目前得出了一些阶段性结论:


第一个是在应用层的社群价值现阶段比技术价值更加珍贵。因为目前的产品形态可能会根据模型能力的变化而变化,直到技术架构稳定,现在看来技术的不确定性很大。当下比较确定的是对 AI 原生应用真正感兴趣的尝鲜用户群体的价值,虽然群体规模可能还不够大,但他们会不停尝试新产品和新功能。如果一款产品能通过现有技术能力满足用户的需求,并持续迭代与用户形成良性的互动,从而积累留存质量高的规模用户,我们认为在长期中将成为较强的竞争壁垒。


第二个是团队需要有全栈认知,对方向的前瞻性判断判断和执行力很重要。这对应我们之前提到的行业竞争的激烈程度和窗口期。全栈认知不仅仅是技术的全栈,也要求团队从技术到产品到用户的全方位理解和认知。


Q2:如果投 AI 相关公司,会重点投什么轮次和阶段?你的投资标准里包括了哪些必备条件?


刘大卫:我们专注于 AI,例如大语言模型技术(LLM)在应用层的机会,但目前看来底层大模型的技术迭代在未来 2-3 年的周期中会持续显著爬坡,因为GPT-4 出来之后到 GPT-6 出来之前,底层的大模型技术还不够成熟,包括数据质量、数据标注等方面还有很大的提升空间。所以应用层比较好的爆发落地的时间可能是在底层大模型的爬坡放缓之后。AI 方向技术与产品的发展美国基本保持有半年的领先期,从用户端或投资端来看,应用层真正大规模繁荣,并出现上亿 DAU 体量的规模性平台性应用的时间点大概率会在 1-2 年之后


Capital O 投资阶段主要专注早期,创业团队要完整、想法明确,要有可以描述场景的产品 demo,这是在 PMF 验证前就需要做到的。必备条件包括:要深刻的用户洞察和对场景的思考,从用户角度思考问题设计产品,能解决实际问题。


Q3:如果投 AI 相关公司,最看重哪些创业者的特质?


刘大卫:我比较看重创业者对技术的前瞻性感知和判断、对产品全局的深度思考、对用户需求的洞察以及执行力和团队管理能力。


在 AI 时代其实有两种投资逻辑:第一种就是投人,找明星创业者,或者动手能力强、生态型、社群型的创业者,前者在过去也是宠儿,后者则非常适合做现在的 AI 创业;第二种是投资源,我们发现现在有些项目已经不是 AI driven 了,而是靠 BD driven,所以一些 BD 资源强的人也很适合创业,比如我们看到一些资源型创业者就非常有潜力,先天资源有优势,且自身有才华又努力,对行业的洞见也很深刻。


Q4:这几年最打动你的一个创业者是谁?他有哪些特质打动你?


刘大卫:晶泰科技的温书豪。最打动我的是他所具备的生态性,晶泰科技从 AI制药拓展到 AI 挖掘材料,不断在吸引优秀创业者,麻省理工、加州理工很多的优秀创业者都是围绕着晶泰的生态在创业,晶泰也衍生出了很多优秀项目,比如莱芒生物,我们当时投晶泰时看重的就是它的整片生态,生态打法与单点突破打法的力量和抗风险能力是完全不一样的。


此外,温书豪有着非常清醒的头脑和计划,在大家还沉迷于市场狂欢的时候,他就已经开始部署接下来的工作了。


Q5:2024年,你关注最多的一个AI的产品/公司是什么?你觉得它最打动你的地方在哪里?


刘大卫:我关注最多的是 OpenAI,OpenAI 目前依然维持绝对的行业领先优势,其技术栈的发展和模型能力的展示将从根本上影响全行业的格局和走向。


Q6:2024 年,AI 相关的行业,有哪些发展速度是超你预期的?有哪些发展速度是低于你预期的?


刘大卫:超过我预期的是主流投资机构和战略方大多已经看清局面,理清逻辑,甚至比海外机构想的更清楚,并且完成了布局。低于我预期的是平台性规模性应用发展还需要更长时间打磨。


第一波技术突破带来的热潮逐渐降温,但等 GPT-4.5 发布之后市场将会进行一波洗牌,很可能涌现出新的机会和方向。


Q7:对于 AI 领域的明星创业者和非明星创业者分别有哪些建议?


刘大卫:对于明星创业者来说,保持健康的现金流,留在牌桌上等待机会。对于非明星创业者来说,在共识的方向上发现非共识并挖掘价值,同时快速试错快速迭代。

03

核心观点:


1.拥有世界一流的创始团队非常重要,包括拥有强大的技术实力、执行能力。


2.AI 在语言文字和视频上的应用是超预期的,而在机器人方面的发展是低于预期的。


3.未来更好的算法与模型也很可能意味着更多专用的、小型的芯片会迎来发展。


Q1:2024 年,你关注最多的一个 AI 的产品/公司是什么?你觉得它最打动你的地方在哪里?


邵旭辉:我使用最多的 AI 产品实际上是 Otter.AI。在市场份额方面,它是最好的英文AI会议记录管理工具。有了 Otter,我在所有会议中都不再需要手写任何记录了。它不仅在会议结束后立即提供最高质量的会议摘要和总结接下来的任务,还让我能在会议期间随时向AI助手提问,或者基于我所有的会议记录来回答我的问题。由于 Otter.ai 的音频引擎、语音识别、再到自然语言理解都是完全自研开发的,它的记录最准确,AI 助手的回答也更加可靠,产品的迭代完全在自己的掌控之下。


Q2:2024 年,你思考最多的一个 AI 相关的问题是什么?为什么思考这个问题,最近有什么一些结论?


邵旭辉超大算力真的是开发最领先的 AI 技术所必须的吗?如果真是如此,那AI的未来必然会被控制在少数国家的少数大公司手里。这对未来的地缘政治,社会发展的自由公允性,和市场的走向都会有深远的影响。


其实,未来的生成式 AI 并非绝对以算力定成败。算力有限的创业公司或者科研机构,可能有以下三个方向的机会:


首先,创业公司可以打造生成式 AI 的基础设施,解决底层的问题。几乎所有领域的公司,都在考虑自身在生成式 AI 方面的竞争策略。在数据隐私/计算安全、准确性/可靠性、商业逻辑等等领域都会有很碎片化的的要求。而大厂的工具链、服务链只能解决一部分需求,其他的就需要初创企业来填补,比如 Lepton.AI、Corvic.AI、Fairly.AI 等都属于这个范畴。


其次,虽然大公司在算力方面拥有优势,创业公司可以将目光投向专业领域——对于这些领域来说,持续积累的专业数据将会有着不可替代的价值,其中的行业壁垒、合规等方面的积累也能形成一定的护城河。


而更重要的是,不少领域(比如生物医药、网络安全、科研、制造)的底层逻辑和大模型擅长的语言文字视频并不相近,无法直接套用,也不容易简单的做二次开发就能获得好的结果。


从另一个角度来说,大模型也同样打开了许多新机遇,过去一些离商业化较远的领域可能忽然就有前进的动力了,其中往往会有创业公司的机会。比如AI写代码——Augment 以近 10 亿美金的估值融资 2.27 亿美金,Cognition则以20亿美金估值融资 1.75 亿美金,后者创立时间才刚刚半年。近期机器人的热潮也是个很好的例子。机器人公司 Figure 发布的视频大家也都看到了,机器人可以完成复杂任务后,在工业、农业、医疗等领域会带来很多的新变化。


算法方面,我也看好未来的新变化。目前,在生成式 AI 的算法方面,呈现Nvidia、OpenAI、Microsoft 三巨头垄断的格局。今年 GTC 上,Transformer的原作小组首次聚集,八位作者中的七位与黄仁勋对话,核心观点就是:Transformer 已经够老了,期待看到更新的模型


从仿生学的角度来说,这个观点也很站得住脚——目前算法的功耗算力,跟自然界还有很大差距。人的大脑功耗几十瓦。昆虫的大脑功耗是毫瓦/微瓦级的,神经元数量极少,也能完成特别复杂的立体视觉、三维控制、捕猎逃生等感知相关的行为。同等情况下,如果让电脑复现小动物在自然界里识别、控制、捕猎、求生的能力,需要更先进的模型,也一定会逐步出现更先进的模型。

而未来更好的算法与模型也很可能意味着更多专用的、小型的芯片会迎来发展。


比如我们此前投资的 D-matrix,主打存内计算,预计将在 2024年大规模量产,目前已经有大量订单。另一个模拟计算芯片设计企业Tetramem 也备受关注,已经发布了多篇 Nature 论文。


除此之外,开源的相对小型的 Transformer 模型(如 Microsoft PHI-2、Mistral 7B)也会迎来快速发展。在我看来,这些开源的小模型对于AI行业持续、健康的发展是很有必要的。这次AI的热潮与以往的科技潮不同,大公司并未占据所有重要的研究方向——谷歌上市时,许多大学就停止了对搜索算法的研究,因为谷歌已经有了很好的团队和资源来推进搜索算法。而生成式AI则不是,对于研究机构而言,这些开源的小模型中还有很多值得探索的地方,目前所有名校的计算机系也都在积极研究开源模型。

未来我们期待的新的算法很可能就会从这些科研人员的工作中涌现。


Q3:2024 年,AI 相关的行业,有哪些发展速度是超你预期的?有哪些发展速度是低于你预期的?国内 2024 年下半年的AI领域的投资可能会呈现哪些特点?


邵旭辉:AI 在语言文字和视频上的应用是超预期的。而在机器人方面的发展是低于我的预期的:目前看到的几个“头部”公司,虽然都有巨大的资本投入,发出来的 demo 都比较初级,没有解决核心的问题。


我的预测是到今年下半年,大多数稍微后期的AI投资会相对趋于理性,不再是简单的投注一个标签,而是要真正看到商业前景和产品的执行力。这也会间接促使早期的AI投资也变得更理性化一点。


Q4:如果投 AI 相关公司,会重点投什么轮次和阶段?你的投资标准里包括了哪些必备条件?


邵旭辉:我们的AI投资专注于种子轮阶段。在这一阶段,我们基金合伙人的成功创业经验和对行业深入的了解不仅能帮助我们更好地评估这些早期AI技术,还能帮助创始人顺利度过关键的初始阶段。


投资标准/理念:我们 100% 专注于北美市场,并且 100% 专注 B2B 企业。我们的投资理念是被投企业必须具有重大技术创新。换句话说,技术壁垒对我们来说是必须的。


Q5:如果投 AI 相关公司,最看重哪些创业者的特质?


邵旭辉:AI 初创公司正逐渐呈现“赢者通吃”的趋势。因此,拥有真正世界一流的创始团队非常重要。这不仅包括拥有最强的技术实力,也包括强大的执行能力。


Q6:这几年最打动你的一个创业者是谁?他有哪些特质打动你?对于AI领域的明星创业者和非明星创业者分别有哪些建议?


邵旭辉:Jerry 是我们去年投资的生成式 AI 公司 Supio 的 CEO。我认为 Jerry具备我们所看好的 CEO 的两个特质:一是能够简明清晰地解释复杂的技术产品,做好广义销售;二是 120 分的勤勉,他真正热爱自己的工作,并且夜以继日地致力于优化公司各方面的业务。(虽然这种特质在中国较为常见,但在美国文化中,这第二个特质相对罕见。)


对于明星团队,比较容易在一开始得到投资人的认可/追捧。一定要头脑清醒,不要把估值等同成就,把融资额等同成功率。专注技术,把产品做好。不管有多少融资,都要讲求最高效率。创业是个马拉松比赛。在赛道上跑得长远的团队才有机会赢。

对于非明星团队,精确定位一个狭窄的垂类,把自己的优势充分体现出来,让自己成为在这个垂类的“明星”,用扎实的科研和相关调研来说服投资人;用实际行动来证明市场。在技术创新有大的变更的时期,往往是非明星团队能够打破常规,另辟蹊径,最后成为赢家的。

04

核心观点:


1.我更偏向于在大模型创新上有非常强的认知、并且能不断推进大模型创新路径的创业者。


2.谁能发出万亿模型、谁能代表多模态、谁能追赶 GPT-4 和超过 GPT-4,就有机会上 AGI 的牌桌,做不到的就会分化下沉下来用开源做垂域大模型。


3.2024 年将会是国内 AI 一个重要的节点:中国将会迎来大模型的分水岭。


Q1:2024年,你关注最多的一个 AI 的产品/公司是什么?你觉得它最打动你的地方在哪里?


宋春雨:如近期大火的 OpenAI 发布的 Sora,它不只是文生文,而是创造了一个视觉、语言完全融合的新世界。这种技术形态很符合我们的预期:视觉模型和语言模型的融合,将产生一个强大的基础模型。Sora 的成功并非偶然,OpenAI此前已具有万亿参数的大模型 GPT-4V;推出 Sora 是在站在巨人的肩膀上向上拓展。OpenAI 早期的对手 Pika 缺少这样的万亿模型,只能在一个小模型基础上发展,无法与 OpenAI 匹敌。后续双方的差距也在我们的预测之内。


Sora 的出现,更坚定了我们对多模态大模型对于 AGI 有着关键意义的判断。


Q2:2024 年,你思考最多的一个 AI 相关的问题是什么?为什么思考这个问题,最近有什么一些结论?


宋春雨:2024 年将会是国内 AI 一个重要的节点:中国将会迎来大模型的分水岭。在中国的基础大模型牌桌上,各家公司在2024年会围绕自己的优势领域,做出分化和选择。这个节点的出现,与大模型演进路径密切相关。


不同于语言大模型,多模态大模型的数据不能简单来源于互联网,多模态路线更为复杂、门槛更高,主要体现在数据、算力、算法三个维度上。


在多模时代,训练的样本和训练的数据要靠大模型生成,或者像自动驾驶一样让机器去理解和吸收物理世界的数据。多模态对算力的要求要 10 倍于文本,如比如GPT-3.5 阶段上千张卡即可满足;但在多模大模型的时代,GPT-4 级别的训练即需要单一集群万卡,这是入门门槛,这种对算力的跨越式需求在多模大模型的时代也如此,单一集群万卡将是多模态大模型训练的入门门槛。

另外在算法方面,目前语言模型和视觉模型还是两个框架的模型,多模模型尚且没有任何开源。可以毫不夸张地说,谁能发出万亿模型、谁能代表多模态、谁能追赶 GPT-4 和超过 GPT-4,就有机会上 AGI 的牌桌,做不到的就会分化下沉下来用开源做垂域大模型。


Q3:2024 年,AI 相关的行业,有哪些发展速度是超你预期的?有哪些发展速度是低于你预期的?


宋春雨:国内应用生态的发展速度是超乎预期的,但这个预期不能马上对标美国。从美国来看,大模型应用正处于新物种大爆发的风起云涌时代。A16z 最新发布的报告显示,按用户使用时长、下载量排名的AI应用榜上,已经比半年前多出 40% 左右的新面孔。国内的应用受限于基础大模型,还没有到大爆发阶段,但仍然出现了很多项目,在小模型的基础上,快速构建对一些行业的数据独占。


尽管如此,相较于AI应用的概念而言,国内基础大模型的发展速度还是低于预期的,开源模型的核心价值还是在垂直领域,因为高质量知识和专业的data能够高效运营,在垂域领域形成价值闭环和商业价值,但其本质并不是基础大模型。互联网时代应用的本质是「连接」,大模型时代的应用是「智力」,AI应用对外输出的是硅基智能,它 95% 的能力都在大模型里,如同 Sora。只有拥有一个超级强的大模型,才有可能诞生 Super APP,并构建数据、模型、应用的商业闭环。


Q4:你认为,国内 2024 年下半年的AI领域的投资可能会呈现哪些特点?


宋春雨:2024 年中国将迎来大模型的分水岭,这种趋势不仅仅发生在技术层面,更会发生在整个创投圈。创业者会更倾向于差异化发展,比如有一类就主攻多模态、还有一类会围绕行业的应用去做垂域模型,甚至将围绕 To C 端迭代出类似于移动互联网时代的短视频平台这样的现象级应用。


AI 投资领域也将围绕企业的生长路径发展出若干流派,如目前已经出现一类投资人只看上层应用,因为商业化能力较强。对于商业化这个概念,很难说在什么节点实现盈利就是完全正确的。


Q5:如果投 AI 相关公司,最看重哪些创业者的特质?


宋春雨:在 AI 领域,我更偏好于在大模型创新上有非常强的认知、并且能不断推进大模型创新路径的创业者。只是这些特征在实践层面上是困难的,我们一直在关注,哪家大模型团队更有通向 AGI 的实力。


Q6:这几年最打动你的一个创业者是谁?他有哪些特质打动你?


宋春雨:印象深刻的企业较多,联想创投关注过AI的多个细分领域,包括现在热度较高 To B的垂直模型公司。澜舟科技这样专注于垂直模型的被投企业就非常典型,大模型 To B 赛道上可能有很多家初创企业,彼此之间决定成败的因素可能在于对整个产业理解是否深刻、对底层逻辑是否吃透。澜舟科技的创始人周明老师围绕金融、互联网营销等切入,他在这些领域的 know-how 相当深刻。

文章来自于Founder Park

关键词: AI应用 , AI创业 , AI商业化 , AI , AI落地
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0