ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
3537点击    2024-02-04 16:42

大模型应用爆发年,谁能率先突围?


岁末年终,大模型厂商们又秀了一波“肌肉”。


2月1日,此前在大模型领域一直保持“静默”状态的字节跳动终于有了新动作,其上线了“Coze扣子”AI Bot开发平台;与过往聊天机器人的形式不同,“扣子”更像是2023年11月Open AI发布的GPTs,可以让用户通过聊天、调用插件等方式,创建个人定制版Bot,实现“0代码”开发。



图片来源:微博截图


除了字节下场外,猎豹移动CEO傅盛创立的猎户星空也在1月21日发布了自己的大模型Orion-14B; 傅盛强调,在企业应用场景中,猎户星空大模型在结合企业私有数据和应用时,即可实现千亿参数级别的模型效果。


而诸如科大讯飞、三六零等在2023年就第一时间抢滩大模型的厂商,如今则正迅速迭代;前者在近日发布了星火大模型V3.5,后者则上线了大模型搜索App“360 AI搜索”。


就在不久之前,手机厂商也纷纷涌入了大模型赛道。1月10日,荣耀发布了自研的70亿参数端侧AI大模型“魔法大模型”,自此,华为、小米、OPPO、vivo、荣耀五家国产主流手机厂商在大模型领域齐聚。同时,大洋彼岸的苹果据传也正在测试在iOS 18中引入生成式AI功能。



图片来源:微博截图


“百模大战”似乎并没有随着时间的流逝而偃旗息鼓,反而是愈演愈烈。厂商们如今都打着怎样的算盘?2024年的大模型赛道会迎来新的重大变革吗?


01.大厂涌入,赛道拥挤


ChatGPT的出现并非毫无征兆。


创造它的OpenAI早在2015年便已成立,并在2018年就推出了初代生成式预训练模型GPT-1,这也是ChatGPT最初的原型。


在此之前,业内的NLP模型(自然语言处理)主要是基于针对特定任务的大量标注数据进行训练,能力有限。


GPT在自然语言推理、问答任务和常识推理等方面取得了突破,为此它也获得了微软10亿美元投资。随后,从GPT-1到GPT-2,到GPT-3,短短2年时间里GPT的能力不断提高。



图片来源:OpenAI官网截图


2022年11月27日,随着由GPT-3.5修改而来的人工智能对话聊天机器人ChatGPT的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得ChatGPT一经发布迅速走红,5天时间注册用户数超过百万,两个月时间月活突破1亿,成为史上增长最快的消费者应用。


消息传至国内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震惊之下,淘宝上售卖ChatGPT账号甚至都成了一门生意。与此同时,看到巨大商机的各界大佬们,也纷纷下场,表态要尽快推出自己的大模型。


从2023年的3月到9月,各个互联网大厂在该赛道争先卡位。从百度的大语言模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。


此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,甚至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。



图片来源:华为云AI公众号


2023年5月的中关村论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而据GitHub的统计数据,到2023年底国内已经发布的大语言模型接近300个。“百模大战”早已不是虚言。


不过相比当初外卖界的“百团大战”,“百模大战”对资金的需求更为苛刻。


根据NVIDIA官方信息,在训练底层模型阶段,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,而为了维持日常推理,OpenAI至少需要3.24万张A100;以此推算,ChatGPT仅硬件成本就超过了8亿美元。


昆仑万维集团CEO方汉更是公开表示,“没有2000张A100的卡,实验都做不了”。为此,海天瑞声、因赛集团等“AI概念股”甚至接连发布定增预案,募集资金用于训练大模型。



图片来源:罐头图库


此时,如何在缩小与ChatGPT差距的同时,尽快找到应用落地的方向,并实现自我造血,成为了“百模大战”中,每一位参与者都要面对的问题。


02.大模型,有何应用场景?


从商业角度分析,大模型带来的机遇,可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。


大模型超强的人机对话、图文及音视频生成能力,不但让其在传统客服场景中获得了广泛应用,对于游戏、影视制作等也产生了深远影响。


阿里、美团的在线智能客服算法,以及中国移动的“九天大模型”、中国电信的TeleChat大模型等,都属于此类产品,将应用场景直接锁定在了智能客服、智慧政务等方面。在2023年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的5G新通话,接完电话之后,申请服务,会即刻转成文字、生成纪要、生成待办事项。


游戏、影视制作方面,导演陆川曾在采访时表示,“用AI画电影海报,15秒出来的效果比专业海报公司做一个月的还要好。”



图片来源:微博截图


原有市场需求再扩大,则体现在对于传统业务的升级上,这也是大模型应用最广泛的领域。


以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更确定的答案。以此为基础,百度地图、网盘、文库等应用都能通过接入大模型进行重构。


旗下业务众多的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。



图片来源:腾讯混元官网截图


此外,在传统的教育、医疗、汽车等领域,大模型也获得了广泛的应用。


接入讯飞星火大模型后,科大讯飞的学习机实现了AI一对一辅助教学、中英文作文批改、口语陪练等功能;百度推出了产业级的医疗行业大模型“灵医”;华为云盘古大模型的赋能,则让问界新M7在智能驾驶领域“遥遥领先”,两个月大定突破10万台。


在创造新的市场需求方面,AI超级助理、AI机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、通义千问等在内的各家通用大模型都有相应产品,它们大都能理解用户的语言语义,并具备图像理解能力,可以通过调用软件API,使用各种各样的工具来帮助用户完成任务;而后者则已有包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出过相关产品。



图片来源:通义官网截图


不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的应用不难发现,不管是提高效率还是扩大需求,市场上绝大多数的应用,实现的功能都较为雷同。


以AI学习机为例,除了科大讯飞有相关产品外,接入子曰大模型的网易有道、接入MathGPT的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入360智脑的360,都有类似的产品在售。功能方面,各自宣传的也都大同小异,AI一对一辅导、全科AI作业助手、虚拟人口语教练等,站在消费者的角度,几乎很难体会到其中的差别。



图片来源:罐头图库


尽管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强;但体现在实际应用中时,那百分之几甚至是千分之几的差别,还是让人不得不产生疑惑:我们真的需要这么多大模型吗?


03.2024会出现“杀手级应用”吗?


尽管市场中的大模型让人眼花缭乱,但行业对大模型发展的趋势还是形成了一定的共识。


百度创始人李彦宏就曾表示:“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”360创始人周鸿祎也在今年年初谈及大模型发展趋势时称,2024年将成为大模型应用场景之年,会出现“杀手级应用”。


这也意味着,大模型与C端用户的距离会越来越近。


字节的“扣子”平台就是一个例子。据“趣解商业”了解,其有着无限拓展的能力集,用户可以通过添加插件的方式,来不断强化自定义Bot的能力;此外,用户还能将本地文件上传到Bot的知识库中,供其学习;创建出来的机器人,还能部署在不同的社交平台和应用程序上。



图片来源:扣子官网截图


这等于是给用户提供了自己开发聊天机器人的机会,让更多人能参与到AI生态的建设中。


与此同时,大模型也正在经历软件、硬件一体化协同的过程。


在这方面,智能手机厂商无疑是业界的代表。据“趣解商业”不完全统计,在国产智能手机中,目前华为Mate60 Pro、小米14 Pro、vivo X100系列、OPPO Find X7系列、荣耀Magic6系列等手机都已搭载大模型。


这些大模型除了能让AI助手变得更为智能外,还有一个重点的应用领域是手机相册。原来想消除照片中的其他游客,只能用PS,且考验手法和技术;现在直接应用AI抹除功能,就能一步到位且几乎没有破绽。


类似的还有美图公司(1357.HK)自研的AI视觉大模型“奇想智能”。其已与三星达成合作,用户可以在Galaxy S24系列手机上体验AI图像编辑功能;不仅可以“智能p图”,还能通过用户给出的图片进一步生成“AI画风”。



图片来源:微博截图


与手机对标的场景是PC(电脑)。1月,联想已经发布了AIPC产品,其在内嵌大模型后,有更强的算力支撑能力、人机交互更为智能、应用生态也更加开放。


而金山办公(688111.SH)推出的WPS AI就是可以在PC平台上应用的软件产品。其将重点放在了智能文档上,可以帮用户轻松创作办公所需的文本、PPT,还能自主消化PDF等文件资料,并解答有关这些资料的问题。


此外,教育也是一个重要的应用场景。科大讯飞、好未来、作业帮、网易有道等厂商都将大模型融入AI学习机中,教育类学习平板电脑的销量更是在2023年直线上升。而且基于产品的迭代,学习平板的价格还在不断走高。



图片来源:罐头图库


深度科技研究院院长张孝荣认为,大模型未来可能会朝专业化与个性化、低门槛化的方向发展。模型的功能会更加细分,针对特定领域或特定需求进行优化;同时通过提供更友好的界面和更便捷的接口,降低使用难度,让更多的人参与到基于大模型的开发和研究中。


而且由于算力所限,大模型可能更多地部署在云端和边缘端;这样可以降低计算资源和存储资源的消耗,提高模型的响应速度和可用性。


但无论是哪种趋势,都要与实际成本相结合;否则只是一味投入,显然难以为继。


三六零(601360.SH)在2023年上半年,尽管新兴业务“360智脑”创造了近2000万元营收,但在9.1亿元的总收入中,占比不过2.1%。



图片来源:罐头图库


科大讯飞(002230.SZ)2023年预计扣非净利润同比下降71%-81%,主要原因就与公司在自主可控平台上加大认知大模型研发投入有关。


除此之外,如何让用户更好地理解大模型的决策过程和结果,提高其信任度,也是一个关键的问题。


04.中外大模型差距在哪?


国内大模型产业如火如荼,美国则更甚。根据《中国人工智能大模型地图研究报告》,全球累计发布的大模型中,中美两国大模型数量占近80%。早在2023年5月,美国10亿级参数规模以上的基础大模型就已突破100个。


除了广为人知的ChatGPT外,美国具有代表性的通用大模型公司还包括Anthropic、Cohere以及Google等。


其中,Anthropic被称为“OpenAI劲敌”。其研发的聊天机器人Claude能一次性总结约7.5万个单词,比ChatGPT更适合处理长对话和内容、对大量文档进行深入分析,而且具备更快的平均响应时间。



图片来源:微博截图


Cohere的特点则是其差异化的定位。不同于OpenAI,其坚定选择了toB路线,提供灵活性存储和资料隐私保护路径,强调安全性、隐私及定制化服务。


至于Google,最新的情况是推出了AI模型Gemini,特点是多模态处理和对复杂逻辑的理解能力。在行业标准MMLU(多任务语言理解)基准测试中,Gemini是唯一一个成绩超越人类专家测试结果的AI模型。



图片来源:微博截图


北京市社会科学院研究员王鹏认为,中美大模型的差别主要体现在融资水平、基础大模型发展水平和应用层发展水平三个方面。


据不完全统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域融资总金额约140亿美元,占世界总融资金额的55%,平均轮次融资金额为3.3亿美元。同期国内人工智能领域则要谨慎得多,投资事件数量同比下降49%,涉及总金额61.74亿元,同比下降62%。


而在基础大模型发展水平方面,国内大模型还存在数据总量缺乏、算力资源缺乏、场景渗透率有限等问题。毕竟从公开数据量上看,英文数据本身占主导优势,美国还在采取多种方式限制中国获取算力的核心资源。


至于应用层方面,中国同样处于跟随状态;其中在办公、金融及医疗领域落后美国较为明显。


针对众多国内厂商都有宣称自家大模型已经超越GPT-4的情况,张孝荣认为:“从理论上说,某些厂商有可能在局部领先于GPT4,但考虑到双方在算法、算力和数据资源等方面的投入,国内模型全面超越GPT4的可能性比较小。”


在他看来,需要正视国内外大模型的差距,这涉及到技术、人才、资金等各方面的因素。


好消息是,中国有着超大的市场规模以及丰富的应用场景,为大模型的落地应用提供了广阔的空间和条件。而且越多的数据、场景,越能让大模型更实用。这让中国在底层研发技术上略逊于美国的情况下,依然具备赶超美国的机会。


但无论中国还是美国,在大模型这条赛道上都还有很多难题待解。最典型的就是输出结果可信性不足、稳定性不强、以及安全性等问题。


对于人和AI来说,这都将是一个长期的学习过程。


文章来自于微信公众号 “趣解商业”(ID:qujieshangye),作者 “张凯旌​”


关键词: coze , 扣子 , AI bot , 字节海外AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI接微信公众号

【开源免费】aiwechat-vercel是一个可以帮助你将AI接入微信公众号,帮你进行实时回答的项目。

项目地址:https://github.com/pwh-pwh/aiwechat-vercel

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/