ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
2024大模型之战:从技术浪漫到落地求生
2746点击    2024-10-08 11:34

AI大模型技术商业化探索与竞争加剧。


从业者们从技术浪漫到商业务实的心态转变,正不断推高大模型市场竞争的激烈程度。


焦虑裹挟中,国内AI大模型圈正不断加速。


融资速度,率先成为最显性的角逐点。大模型需要消耗大量算力和资源,于是资金成了入场券。


2024年以来,每隔一段时间,就会传出大模型公司拿到新融资的消息。这些消息,像是断断续续投射到行业上空的信号弹,搅动着每个人心中的天平。


这个围绕机器学习、数据处理、数学、算法等理性内容展开的赛道,充斥着欢欣、失落与迷茫。


复杂的情绪来自多个方面:一是,大模型技术的进展,与预期差距很大;二是,投入巨额资金后,何时见效尚未可知;三是,如果继续投入,资金来自哪里;四是,如果靠自己造血,哪些场景距离变现最近。


有预算的企业客户成了香饽饽,正被大模型厂商们争夺。2024年9月初,国信证券旗下“AIGC投顾助手项目”开标,项目金额只有160万元,但仍吸引了7家大模型厂商激烈竞标。面对客户,一拥而上是常态。在一些项目的公开招标过程中,投标厂商们的投标价差,可能达3倍之多。


一部分焦虑来自投资端。“投资人焦虑的是一大堆钱都投进去了,但应用迟迟起不来。如果应用起不来,整个行业价值是不是比原来预期要低?之前这么高的估值,这么多的钱投进去了,将来能不能修成正果?”创新工场联合CEO汪华向《中国企业家》分析。


市场研究机构CB Insights发布的《2023年人工智能行业现状报告》显示,2023年全球生成式AI新创企业共获得约204亿美元融资,是2022年的5倍以上。其中,中国AI领域投融资数量约为232笔,融资总额约为20亿美元,且大都集中在头部AI企业。


时间回到一年半前,中国创投圈洋溢着久违的亢奋,从线上的媒体、社区,到线下咖啡馆,每个人都在谈论着OpenAI、大模型以及对未来AI世界的畅想。许多已功成名就、处于半隐退状态的明星创业者,如李开复、王小川、王慧文等,也不甘心错过这次难得的技术浪潮,再次出山。


李开复摄影:邓攀


然而,一年半的探索后,大模型技术演进曲线从陡峭趋于平缓,从业者们的心态和关注重心也悄然发生变化。


中国AI大模型的发展路径也出现了分野:一部分人选择继续探索大模型性能边界,他们有一种前所未有的紧迫感,生怕自己被落下,OpenAI o1新模型的迭代,就是他们的强心剂;另一部分人则转向关注如何让AI大模型的商业化应用尽快落地,进入更多的用户场景,积累更多的数据,从而实现商业化闭环。


如果说2023年,各家大模型厂商们都在专注于打磨模型参数、模型性能、榜单排名等各个方面的能力,争相渴望成为“中国的OpenAI”,那么2024年,越来越多的人变得更加务实,开始更关注落地场景和商业化。


王小川告诉《中国企业家》,从去年到现在,被投资人问及最多的问题,也经历了几个阶段, “最早是怎么追上GPT-4,今年是大家都发应用了你们怎么看,现在不这么问了,变成做医疗挺好。”


大把真金白银投入后,创业者与大模型技术的甜蜜期正慢慢消退。 一方面,OpenAI的GPT-5仍然遥遥无期,自2024年年初OpenAI团队演示了Sora文生视频的能力后,Sora的正式产品至今也还未发布,直到最近发布了o1系列模型才挽回一些市场信心; 另一方面,过去一年英伟达市值增长了2倍,甚至一度达到3万亿美元后,投资者们也产生了逆反情绪。


北京时间9月4日,美国芯片制造商英伟达的股价下跌9.5%,一夜之间市值蒸发了2789亿美元(约合人民币19861亿元)。即便在此之前,英伟达已连续一年交出超过市场预期的业绩报告,但还是打破了有史以来最大的单日公司市值损失纪录。


英伟达股价下跌的原因在于,投资者关注的焦点并不是其图形处理器芯片(GPU)产品的销售情况,他们更关心英伟达客户名单上的科技巨头,能否从人工智能领域投入的数千亿美元当中获利。可参考的是,微软CFO表示,他们投在大模型领域的数百亿美元,需要等15年或更久才能回本。


从业者们从技术浪漫到商业务实的心态转变,正不断推高大模型市场竞争的激烈程度。


2024年5月,字节跳动率先发起国内大模型调用成本的价格战,其主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%,引发市场震动。随后,阿里通义千问、百度文心一言等互联网大厂,以及大模型创业公司也纷纷跟进,尝试用低价争夺更多的客户群体。


据智能超参数统计,2024年关于大模型的中标项目共237件,其中,百度、科大讯飞和智谱暂时领跑行业。然而,截至2024年7月底,中国通过备案的大模型已经接近200家,竞争异常激烈。


AI大模型创业公司花钱也变得谨慎。“公司在花钱方面的宗旨是,一分钱掰成两半花,在同等算力的条件下,尽可能训练更多的轮次和数据。”MiniMax创始人闫俊杰告诉《中国企业家》。


“这个行业就跟卖海鲜一样,就是三个月的生意,你训练了一个大模型出来,不管用什么样的价格,只能大概维持三个月,三个月内没有更好的模型基本就废了,竞争非常激烈。”这是猎豹移动董事长兼CEO、猎户星空董事长傅盛今年听到的印象最深的同行感慨。


在消费者端,一场围绕新用户的争夺战也在2024年上半年打响。虽然月之暗面旗下的Kimi以高昂的推广费用和激进的投放策略率先在B站发起冲锋,但字节跳动旗下的“豆包”背靠抖音和穿山甲两大流量池,后来者居上。从2024年5月中旬正式发布,到登顶苹果商店免费应用排行榜第一,豆包只花了30多天。


大模型的核心战场之外,一部分多年深耕于教育、企业服务、能源、制造、医疗等领域的企业,也不甘心错过这一波技术浪潮,渴望借助大模型,解决行业固有难题,实现组织内部的降本增效。


至此,一场围绕AI大模型应用落地的战国混战已经打响。


大模型告别同质化竞争


大模型创业公司们正努力展现各自的差异。


进入2024年8月,月之暗面创始人杨植麟开始将一部分精力放到B端业务上,他们正式发布了Kimi企业级API,以探索在B端的商业模式。


在此之前,该公司的拳头产品是面向C端的大模型应用Kimi,该产品的特长是阅读理解长文本的能力,号称能一口气“啃下”20万字。但进入8月后,众多消费者发现Kimi在高峰时段的响应速度正在变慢。随后,Kimi上线了“给Kimi加油”这一付费选项,用户购买后可获得高峰期优先使用等权益。


而百川智能创始人王小川的愿望是,“用AI大模型造医生”,从而解决医疗资源的紧张和分布不均的问题。


2024年8月28日,百川智能与国家儿童医学中心北京儿童医院签署战略合作协议,双方计划共同推出“一大四小”五款AI医疗产品,以人工智能赋能优质儿科医疗资源扩容下沉和区域均衡布局。


王小川这样解读这次合作的意义:“北京儿童医院将拿出最大化的专家资源和我们合作,我们认为有机会在3年内打造出具有三甲医院主治医师水平的AI儿科医生,相当于造出了100万主治医师,足以覆盖全国乡一级的诊所。”


2023年4月,王小川下场提出“超级模型+超级应用”的双轮驱动实践法。虽然过去百川智能也发布了“百小应”这一应用,但在他看来,医疗才是此轮技术变革中最大的超级应用。


当然用AI大模型造医生现在还面临一系列的问题:比如医疗事关生死,技术上到底靠不靠谱?国家政策法律批不批?商业模式怎么建?


此类问题被问多了后,王小川找到一个特别简单的答案:“那你怎么看无人驾驶,如果出了车祸,无人驾驶同样事关生死,能不能上路也有交通法规,这些担忧不都有吗?那无人驾驶大家干吗做呢?”


王小川来源:受访者


闫俊杰则把今年的重心放在了应用开发上,今年8月底,MiniMax发布了自研的视频大模型。据了解,该大模型可支持用文字生成的6秒高清视频,25帧率,用户已能在海螺AI网页版体验。此外,海螺AI还将上线“图生视频”功能。在此前,MiniMax发布了AI社区产品星野APP,并通过AI应用Talkie在美国拓展业务。


闫俊杰表示MiniMax每日与全球用户发生30亿次AI交互,处理3万亿Token。目前,MiniMax的商业化有两个路径:一是,开放平台,现在已经有超过3万家企业用户和开发者;二是,公司产品里面也有广告的机制,可以做商业化的变现。


不过,在闫俊杰看来,目前行业最重要的关注点还不是商业化,而是真正地将技术提高到广泛可用的程度,即有一个模型能把错误率降低到个位数,让很多复杂任务从不能做变成能做。


“现在所有模型都有两位数的错误率,只有把错误率降低到个位数才可以做复杂任务。因为复杂任务需要多步相乘,乘起来,错误率就会放大。这就是为什么现在很多Agent应用跑不通,GPT-Store也跑不通,本质还是技术不够好。”闫俊杰告诉《中国企业家》。


智谱CEO张鹏算得上今年最炙手可热的创始人之一,同时也是最忙的AI创业公司一把手。除了技术本身,商业化方向的探索也是他关注的——智谱不仅是国内最早一批发布文生视频和类4o视频通话产品的公司,在B端,仅在2024年上半年,智谱就拿到了超过18个来自政府和企业的招标项目,位居6家独角兽之首,甚至超过部分互联网大厂。


2019年6月,智谱成立,其核心创始成员均来自清华大学,技术成果源自清华大学计算机系知识工程实验室。因相比其他AI独角兽成立时间相对更早,智谱从2021年就开始探索商业化。


张鹏深感今年B端市场的竞争激烈,大家抢客户抢得很凶,但他发现大模型时代,B端和C端的差异不像以前那么泾渭分明。“不管C端还是B端,最终大概率都是跟人机交互有关,即便是企业客户最终做完也还是要给个人用的。有很多B端客户是因为用了我们某一个C端产品,才找到我们,界限没那么清楚了。”张鹏告诉《中国企业家》。


客户之外,智谱也正受到越来越多资本的青睐。2024年9月5日,中关村科学城宣布,以投前200亿元估值领投智谱新一轮融资。


此外,智谱的股东阵容也是目前最丰富和多元的,包括高瓴资本、启明创投、君联资本等知名投资机构,美团、阿里、腾讯、小米在内的互联网大厂,中关村科学城公司和北京市人工智能产业投资基金等国资。


最近,张鹏从投资人那里学到的一句话是:“对一家企业而言,你要选择在适当的阶段,把自己并联或串联到更大的战略中,如果你跟国家战略完全无关,你是很难活下去的。”至于怎么理解“串联国家战略”,张鹏认为每个人都会有不同的理解和诠释。


张鹏来源:受访者


谈到此次融资和资方背景,张鹏告诉《中国企业家》:“我们想要跨越一个阶层,告别同质化竞争,把自己的能力提升到另一个水平,这时候就不是单纯靠技术、自然增长、产品能力就能解决。肯定要借助更多不同的资源,和不同类型资源的打通。”


此外,与其他国内AI大模型独角兽不同,智谱在对外投资方面十分积极。IT桔子数据显示,从2023年开始,智谱就已投资了超过20个项目,仅今年就出手了8次。投资的AI企业包括面壁智能、无问芯穹、硅基流动等多家创业公司,覆盖AI芯片、AIGC、数字生物、网络服务等多个领域。


与大厂竞争,远离它们的射程


当AI大模型创业者与互联网大厂同入一个战场后,彼此更懂竞争对手的实力。摆在创业者眼前最现实的问题是:如果腾讯、阿里、百度、字节等互联网大厂投入更多资源来竞争,公司该怎么办?


金沙江创投董事总经理朱啸虎甚至认为,AI大模型“六小龙”最好的归宿是被大厂收购。他断言,5年以后根本就没有单独的大模型公司,只有应用公司或云服务公司。云服务公司免费提供大模型的接口——它是基础服务,基础服务一定会和云在一起。


最先遇到这一挑战的,或是月之暗面创始人杨植麟。


2024年春节后,月之暗面旗下的Kimi异军突起,一度在用户数排行榜上超过文心一言,跃居第一。Kimi用户数攀升的同时,越来越多的B站用户发现,无论首页还是视频推荐区,总能看到“Kimi AI智能助手”的推广广告。


据36氪报道,月之暗面在B站给出的CPA(Cost Per Action,用户转化人均成本)报价高达30元左右。这意味着,Kimi每通过B站获得一名注册用户,月之暗面起码要支付30元的费用,当时有人估算,Kimi每天的获客成本至少20万元,这让其他AI公司望而却步。


豪横激进的投放策略让Kimi保持高速的用户增长。Similarweb的监测数据显示,在B站推广后的2024年3月,Kimi的访问量就呈现出显著的增长趋势,增幅一度达到402.9%。


直到字节跳动旗下AI大模型应用“豆包”的出现,打破了这一局面,仅用30多天豆包的用户数就超过了Kimi,跃居AI产品榜首位。显然,相比月之暗面,字节跳动拥有更雄厚的资金和更广阔的自家流量池。


根据移动广告情报分析平台AppGrowing数据,今年4月到5月期间,豆包的投放金额在1500万~1750万元左右;而到了6月上旬,新一轮大规模广告投放的金额直接飙升至1.24亿元。


效果立竿见影。据七麦数据,5月5日,豆包手机端应用在免费榜排名为112名,6天后的5月11日,攀升至前10。同时,七麦数据显示,截至6月11日,豆包应用排名稳定在总榜免费榜第一。


一位AI公司创始人告诉《中国企业家》:“月之暗面开始转向B端,跟字节跳动旗下豆包的降维打击或许有一定的关系。更关键的是,腾讯元宝还没开始发力,腾讯有用户、有场景、有数据、有模型,要是元宝推广起来,那时可能更没戏了。”


2024年5月30日,腾讯也推出了基于混元大模型的AI助手APP——腾讯元宝。在此之前,腾讯混元大模型主要扮演的是技术底座的角色,已经支持了腾讯会议、腾讯文档、微信读书等腾讯内部接近700个业务,并沉淀出一套平台工具和合作模式。目前,或因微信、腾讯会议等用户基数过于庞大,任何一点小改动,都可能影响上亿人的体验,所以腾讯在将元宝与既有产品联动上,还处于谨慎探索的阶段。


另外,现阶段其实已在推进元宝和腾讯产品和业务的更深度联动。比如,现在电脑管家已经接入了元宝;还有腾讯视频《长相思》,也和元宝有比较深度的联动。


此外,2024年9月4日,文心一言升级为“文小言”,定位“新搜索”智能助手。今年二季度的财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度已有18%的搜索结果由AI生成,且这一比例还在不断提升。


在王小川看来,走出互联网大厂的射程,确实是AI大模型公司一把手们必须考虑的问题。这一波AI大模型创业浪潮中,创业公司的生存空间就在于,“你得走出大家的共识,在共识内是一件危险的事,当公司被看得特别明白,那就不是创业公司了,非共识才是意义。”王小川告诉《中国企业家》。


C端应用外,即便在B端,AI大模型创业公司依然需要与互联网大厂同台竞技。其中,互联网大厂往往是大模型厂商,还是云服务厂商,它们拥有更多的资源。另一个明显的事件是2024年5月以来,互联网大厂发起的模型调用成本的价格战。


字节跳动被视为国内大模型价格战的发起者。2024年5月15日,字节正式发布豆包大模型,主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%,震撼业内。


不到10天,其他厂商纷纷跟进。5月21日,阿里云宣布旗下9款大模型全面降价,降幅最高达到97%,两款开源模型更是开启七天限免。随后,百度直接宣布两款轻量级模型ERNIE Speed、ERNIE Lite免费开放。此外,智谱、深度求索等创业公司也加入战局。


不过,张鹏否认了价格战这一说法。


“作为一家初创企业,花的是投资人的钱,我们没有资本去打价格战。我们的每一次降价,无非出于两个考虑:第一,技术上的进步带来成本的降低,将一部分利润空间释放给客户;第二,为了拓展市场,形成一定的影响力和品牌认知,降价只是其中很小的手段。”张鹏告诉《中国企业家》。


但无论是否主动发起,智谱等创业公司不得不面对大厂的竞争,企业客户在选择供应商时会天然考虑其中的差异。


张鹏分析:“互联网大厂可能天生会想利用大模型这一波浪潮,卖铲子、卖水,赚一笔再说,至于大模型能不能赚钱再慢慢看,因为它们有现金流支撑,这种商业选择无可厚非。但也不是所有人都会这么选,还有一些人在坚持正常的价格。每家都有自己的逻辑,回归正常的价值曲线需要一个过程。”


MiniMax虽然没有参与大模型价格战,但闫俊杰目前对与互联网大厂之间的竞争持乐观态度。他认为竞争既然不能避免,要看到乐观的一面:企业的使用意愿和大模型的调用量在显著增长,中国模型在海外越来越有竞争力,这是两个积极的变化。


闫俊杰来源:受访者


据了解,MiniMax旗下的社区产品星野,同样面临腾讯、字节跳动、快手等公司的同类竞争。闫俊杰不惧怕竞争,他认为电动车、手机、移动互联网,都是多家公司进行了长期激烈的竞争,最终使中国产品全球领先。


“一家小创业公司,如果在竞争中打不赢,那就应该被淘汰,就应该关掉,其实也没有其他选择。大厂的竞争还带来一个好处,就是让我们能更快看清,创业公司能赢的底层逻辑是什么。比如买量,大厂的实力可能是你千百倍,你在这里和它竞争可能没用。”闫俊杰告诉《中国企业家》。


硬件交答卷,回归解决用户的问题


北京时间2024年9月10日凌晨1点,全世界都在等待应用优等生苹果的AI答卷。


3个月前,苹果CEO蒂姆·库克凭借一场没有任何硬件发布的发布会,让苹果公司股价大涨超过7%,背后的核心正是苹果的AI战略,即“Apple Intelligence”。演示中,Apple Intelligence可利用先进的人工智能和机器学习技术,通过理解个人情境、确定通知的优先级、提供智能写作工具、创建自定义图像以及自动执行跨应用程序的操作来增强用户体验。


然而,在这场2024苹果秋季新品发布会中,持续2个小时的iPhone 16系列新品发布并未带来太多惊喜,Apple Intelligence在中国大陆地区甚至最快要到2025年才能落地。而这个时间还取决于政策的监管审批速度,这也意味着国内iPhone 16系列用户,在较长一段时间内无法充分体验到这一核心功能。


但身在国内的智能手机厂商们不敢掉以轻心。智能手机作为一个用户普及率最高的硬件设备,正成为AI大模型落地最快找到场景的试验田。


2024年春节刚过,一向鲜少对外发声的OPPO创始人、首席执行官陈明永,突然对外释放一个重大判断:“AI手机的全新时代正在加速到来,未来5年,AI对手机行业的影响完全可以比肩当年智能手机替代功能机。通过AI,可以把手机的体验重新做一遍,帮助用户实现更高价值。”


紧随其后,荣耀CEO赵明也公布了荣耀的AI战略,并推出首款AI PC和Magic 6系列旗舰手机。新手机搭载荣耀最新操作系统MagicOS 8.0,强调建立平台级AI,为每个用户提供单独定制的手机系统。


认定AI手机为趋势后,全球各大手机厂商已采取行动,甚至有从业者认为,2024年再不布局AI大模型的手机厂商未来就没戏了。截至目前,国内排名前五的智能手机厂商均在接入多家通用大模型的基础上,开始自研大模型,并发起了人才争夺战。


积极拥抱大模型需要企业对组织架构进行相应调整。


OPPO选择将组织内所有与AI相关的部门从整个公司抽离,成立了一个专门的AI中心。“以前我们有研究院、数字工程、软件工程等各个系统,但每个系统都在做部分AI的能力建设,资源很分散,效率有很大的问题,设立AI中心,就是针对AI去做能力建设和产品研发,从产品到研发再到预演完全实现自己的闭环。”

OPPO首席产品官刘作虎告诉《中国企业家》。


智能手机厂商对AI大模型的重视和投入,也正在影响产业链上游芯片厂商的变革。从2023年开始,高通、联发科等芯片厂商相继发布了在端侧跑通大模型的旗舰芯片。高通总裁阿蒙表示:“2024年会成为全球AI手机元年,生成式AI正在快速地进入手机。”


FOMO情绪(Fear of Missing Out,害怕错过)下,硬件应用正加速落地。


智能手机外,具身智能同样备受关注,AI大模型与机器人的结合,让机器人真正向前迈进一大步。宇树科技发布的H1人形机器人在接入了机器人大模型UnifoLM后,具备了独立学习和高速奔跑、上下楼梯的能力。


“人形机器人目前最大的挑战,也是未来最大的变量,就是AI能力。机器人AI的能力,在全球范围还没有达到一个像初代ChatGPT那样的水平。”宇树科技创始人、CEO王兴兴告诉《中国企业家》。


傅盛也很看好小参数模型在手机、机器人等端侧的落地应用。“小参数模型跑在端上,就意味着AI能力将更加本地化,安全隐私问题、成本问题也都能得到很好的解决,能给用户带来超好的体验。”


今年,猎户星空开发了自己的大模型,并将其开源,客户在私有化部署时有了更多选择,且不需要昂贵的服务器支持。傅盛认为,大模型是机器人的“大脑”,而机器人的身体则是硬件部分。目前,猎户星空接入大模型的机器人,已经在餐厅、酒店、养老院等行业落地。


在傅盛看来,当下大家对大模型的心态和预期很重要。“既不要做大模型的装备党,也不要去迷恋技术本身,做应用的本质就是解决用户问题,关键是谁能解决得好,而不是谁用了什么高超的技术。做AI应用也不能因为我用了AI大模型就觉得了不起,关键得看它真正解决的效率问题。”


找对切入点和优先级,找到商业化节奏


2024年随着越来越多的大模型获得备案许可,围绕大模型相关的商业化进程也进一步提速。


埃森哲发布的调研报告显示,全球77%的企业高管相信生成式AI能给企业的营收增长或效率提升带来机遇。中国企业则更加乐观,90%的中国企业将生成式AI视为企业机遇,其中46%的企业认为它为企业营收增长提供了新的机会,44%的企业认为它能助力企业提升效率。


在接触和服务了众多客户后,智谱COO张帆发现,企业面对大模型的心态存在两种极端:一种是把它当成许愿池,好像什么都可以搞定;另一种是无时无刻不找一些大模型干不成的事,证明它不行。


“今天的大模型相当于iPhone1.0,上面的应用一定比PC好吗?不一定,但起码是一个开始,我们找到合适的程度以及试点,找到对应的负责人并且给予合理的期待,这是关键。”张帆表示。


不过,《中国企业家》观察到,依托已有业务开展AI大模型探索的公司,目前确实已有一部分企业找到商业化路径,且AI带动的营收实现一定的量级。


网易有道的营收中,AI订阅驱动的销售额超过6000万元,同比增长超过200%。2023年7月,网易有道发布“子曰”教育大模型,过去的一年,网易有道以“子曰”教育大模型为基座,推出了有道小P、词典翻译、Hi Echo等10余个应用,并将这些应用落地到全系软件和硬件产品中,覆盖了LLM翻译、AI作文批改、AIBox、语法精讲、体育教育、口语练习、家庭辅导等多个教育细分场景。


网易有道CEO周枫告诉《中国企业家》:“AI大模型落地的关键在于深入理解用户场景,在盈利和商业化方面,订阅模式是一种非常具有扩展性的盈利模式。同时,我们也在探索智能设备和国际市场等其他商业化途径。”


周枫来源:受访者


目前,网易有道旗下的虚拟人口语陪练产品Hi Echo,已经成为AI订阅销售额的重要贡献者。周枫判断,预计今年和明年将是AI应用增长和盈利的好时机。


此外,《中国企业家》发现,AI大模型的引入也正在让一部分移动互联网时代沉寂已久的公司重新焕发生机,比如美图秀秀。


AI大模型已成为美图业绩的强心剂。其8月28日发布的财报显示,2024年上半年,美图收入16.2亿元,同比增长28.6%;经调归母净利润2.7亿元,同比增长80.3%。此外,在硅谷顶级风投a16z发布的《Top 100消费级生成式AI应用》榜单中,美图秀秀位居第九,是唯一进入该榜单前十的中国产品。


AI大模型和妙鸭相机爆发之后,美图董事长吴欣鸿快速捕捉到该技术在视觉领域的机会,将公司的定位调整为“基于用户的需求做AI应用”,深入行业寻找真正的差异化价值点。目前,打开美图秀秀能看到众多影像与设计产品服务,比如付费AI滤镜等,而付费订阅用户数达1081万,付费订阅渗透率超过4%。


这些企业所处不同的行业,入局时间也有先后,但在商业化方面,它们均找对了切入点和优先级,找到了自己的节奏。


过去一年,初心资本合伙人许旸洋看了很多中国团队班底的AI应用类创业公司,但都没有出手。“ARR(年度经常性收入)达到1000万美元的AI公司,可能也就四五家,今年没什么快速增长的新品类出来。更核心的是,AI原生应用相比有业务、用户基础的公司叠加AI功能之后的竞争力,缺乏本质的产品力优势。”许旸洋告诉《中国企业家》。


在B端,中国科学院自动化所孵化的人工智能企业“中科闻歌”,在2023年发布雅意大模型之后,依托过往的AI知识和智能决策业务,目前已服务上百家央国企单位,1000多家大中型企业,覆盖媒体、银行、券商、基金、教育等多个领域。


据了解,中科闻歌核心团队均来自中国科学院等科研院所及海内外顶尖高校,团队拥有十余年大数据、人工智能技术的理论研究、技术研发及应用实践积累,申请发明专利超百项,自研核心算法3000余个,已经形成了深度语义理解、社会计算、AI平台化工程等核心能力。


中科闻歌董事长王磊告诉《中国企业家》:“对于行业数据的深刻理解和知识积累是实现大模型商业化落地的关键。大模型本身并不能直接商业化,而是需要结合行业知识和具体场景,通过模型工程和领域工程来实现真正的商业价值。”


王磊来源:受访者


王磊表示,大模型从模型接入到真正落地必须经历三个阶段:第一,数据工程。企业不是有数据就叫数据工程,而是要筛选哪些数据是AI的高质量语料,适用于大模型后训练和微调,形成基础AI数据和语料库;第二,模型工程。不是接入市面上的GPT等基础模型就完成了模型化工作,还需要进行模型精调和微调,甚至要融合多个模型的能力,使其具备行业能力;第三,领域工程。即该行业的问题是什么,真正通过大模型和数据解决的需求是什么,需要如何做进一步的复杂建模和推理,让大模型结合业务场景真正做到服务智能决策。


而在B端具体落地方面,智能超参数发布的《中国大模型中标项目监测报告》显示,2024年1~8月,国内大模型相关中标项目数量达到475个,约是2023年全年大模型中标项目数量的5倍。披露的中标金额达到15.35亿元,约是2023年全年大模型中标项目披露金额的2倍。


这些项目覆盖能源、教育、通信、技术服务、金融、政务、传媒、运输、商业服务、烟草、医疗、制造等10多个行业。其中,央国企大模型中标项目达到295个,中标金额总额9.63亿元,在整体市场上的占比为62%,金额占比达到63%。


不过,目前企业的数智化水平,依然是制约AI大模型落地与公司业务结合的关键因素。


埃森哲全球副总裁、大中华区技术服务事业部总裁俞毅,就曾在《中国企业数字化转型指数报告》中表示,中国企业整体上云的比例相比全球平均水平偏低,如果不上云,应用AI大模型就会存在很大局限,成本也会更高。


与此同时,许多中国企业在如ERP(资源管理系统)、CRM(客户管理系统)等核心数字系统建设上有“欠债”。此前的投入可能集中在功能性系统上,而缺乏底层数据的打通,在应用AI的过程中会发现缺乏相应的数据,技术“债务”问题非常明显。


经历一年多实践,从业者们逐渐形成的共识是,大模型要真正发挥作用,并不是简单的技术部署,而是需要与企业、行业数据进行深度融合,包括在此过程中不断进行迭代和优化,甚至跟企业组织、流程强相关。


用友董事长王文京告诉《中国企业家》:“云计算、大数据和AI是企业数智化建设和发展中最核心的3大技术,其中AI技术在企业的应用经历3个层级:从感知级,如RPA、规则引擎、语音识别、图像识别、OCR等;到认知级,如NLP、机器学习平台、智能搜索、VPA、数智员工、知识图谱等;再到慧知级,最具代表性的就是大模型和智能体。”


当然,大模型厂商在选择落地时也可以根据产业和企业的数智化水平,遵循一定的路径。张鹏告诉《中国企业家》:“选择落地哪些行业,其实有一定的优先级和技巧。我们最早进入的是金融和互联网,它们的数智化程度比较高,技术积累也非常不错,也非常有付费意愿,PMF计算也比较清晰。”


耐心与现实


目前,国内AI大模型的商业化落地,无论在C端,还是B端,均仍未有清晰的探索路径。


在C端,大多数AI产品仍然面临用户黏性不足,收费持续性不足的问题;在B端,大模型在接入具体业务场景的过程中,则还无法做到“开箱即用”的便利程度,工厂老师傅几十年积累的产业经验,也很难短时间被大模型内化。此外,部分项目甚至依赖深度定制化服务。


尤其在B端应用方面,傅盛认为大模型落地仍有三大阻碍:


第一,数据的体量。大模型的训练数据来自互联网,但实际上互联网只是人类知识系统冰山显露出的一小部分;


第二,数据的安全性。大模型和云最大的不同,云更像仓库,是不拆包的,只要租用我的仓库,我不关心你存了什么。大模型不一样,存在其中的数据它都要看一遍,才能写报告和整理;


第三,生成式的模型,大模型的幻觉不可避免,关键它还不知道自己错了。人说错话,马上就知道,但大语言模型会一本正经地讲林黛玉拿绣花针打虎的故事,没有反思能力。今天我们发现和大模型打通以后,如果做客服需要达到人95%以上的能力,但大模型只能做到70%,这是目前大模型落地时天然的缺陷。


朱啸虎表达了同样的担忧。


“为什么现在AI Agent不能落地,因为大模型天然有幻觉,单步的错误率可能在10%~20%,5步推理以后可能错误率就50%以上了,完全没法用。B端你真的要懂垂直行业,而且要有垂直行业数据,不然根本没有机会优化模型、降低错误率。”朱啸虎在接受界面新闻采访时表示。


不过也有人对未来依然乐观。生数科技首席科学家朱军在云栖大会上提出了AGI发展的L1~L5阶段:


L1相当于是聊天机器人,ChatGPT类的应用,之前大家都做了很多;


L2是推理者,可做复杂问题的深度思考、推理;


L3是智能体,是从数字世界走向物理世界,模型要去改变,要去交互;


L4是创新者,要去发现、创造一些新的东西、新的知识;


L5是组织者,可以去协同或者是有某种组织的方式,来更高效运转。


朱军认为,现在业界对AI未来的整体预测,都过于悲观和保守了。如今我们还处于L2的发展早期,但AI仍在加速发展中,未来18个月甚至有可能出现L4级的突破。


MiniMax目前在C端已经有多款产品,在闫俊杰看来,当一个产品没人用或者不赚钱时,肯定不能怪用户、怪生态,只能怪自己。


“腾讯在2000年时也不知道该怎么赚钱,尝试无数商业化变现方案都失败了,但最终找到了移动增值业务、QQ、游戏,都会经历这么一个过程。这个事(商业化)是对一个行业的考验,如果能通过就能出来,通不过确实应该关掉。至少我们目前在努力希望自己变得更好,这是我唯一可以做的事。”闫俊杰告诉《中国企业家》。


月之暗面创始人杨植麟同样有自己的产品方法论,他认为需要摒弃原来的思维定式。“传统互联网和AI产品最大的区别,一个是先设计后制造,一个是通过制造完成设计。”杨植麟在Monolith砺思资本分享时讲道。


针对C端产品的用户黏性问题,张鹏则认为,“不要太固执、守旧地看待某些东西,也许现在的事情并不适用于原来的目标来衡量。应该更开阔地去看问题,AI大模型发展再快,毕竟还处于早期,像电这样的通用性技术,你能离得开它吗?这时候你强调它的黏性可能没啥意义。”


智谱也是目前在B端中标项目最多的AI大模型创业公司。关于定制化交付的商业模式问题,在张鹏看来,过去的AI在技术层面的问题在于,技术的通用性不够,依赖定制化交付,某一个具体任务下,都需要把这个技术从头到尾走一遍,过程中摆脱不了大量的定制和人员经验的投入,任务成本是线性叠加的,因此成本一直居高不下,边际效应很差,因此最终的利润空间就非常小,稍有不慎项目可能就亏损。


来源:受访者


“现在的大模型技术给了一个全新的路径去解决这些问题,原来每个任务需要单独做数据收集、标注、建模等工作,但现在用预训练的方式就能解决相当大一部分,所以交付成本其实是相对低的,且同类任务越多,平摊成本就会越低。大模型带来的新的经济模式,可以一定程度规避上一代技术缺陷,带来一种新的可能。”张鹏告诉《中国企业家》。


过去一年多时间,张鹏确实听到过很多不同的声音,但他认为很多时候,无论是坐而论道还是焦虑,不如踏踏实实做一些事情,有所行动。


“大模型最终变为生产力,需要一个慢慢渗透的过程。一个技术再威力无穷,到真正落地还是需要解决很多问题,你不用是碰不到的,也是不会知道的。也许就在我们还在讨论什么时候会诞生的时候,回过头发现每个人已经都用上了。”张鹏告诉《中国企业家》。


如果AI大模型技术真如张鹏所言,是一次类似电力发明这样基础的变革,那不要忘记,电力出现后,至少过了30多年都没有带来生产力的提升。因为电力太基础了,传导至生产端需要很长的一段时间。


但是,又有多少家AI大模型创业公司能在缺乏变现能力的情况下活过3年?


文章来自于微信公众号“中国企业家杂志”,作者“赵东山 孔月昕”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
AI医疗影像

【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。

项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file

3
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner