中国大模型平台市场第一!
大模型应用落地元年,百度最新成绩单出炉——
刚刚召开的百度云智大会上,百度智能云一边秀市场成绩,一边还拉来三星、南方电网这样的行业大客户,现场秀落地效果。
此番动作并不稀奇。9月份云厂商们热火朝天密集发布,不同于去年的秀模型、秀算法,今年大家更愿意聊应用、聊行业价值。
大模型趋势,很快到了拿实绩说话的阶段。
为何百度智能云能成为“标王”?从最新发布看起。
今年百度云智大会一共带来5款AI产品升级,分别是:
它们共同构成企业大模型产业落地的全栈能力,也能分别满足企业应用大模型的不同需求。
首先来看大模型应用落地最不可或缺的底层算力基础设施。百舸·AI异构计算平台正式发布4.0版本。
它以混合多芯技术为基础,由下至上分为资源层、组件层、加速层和工具层,为企业提供大模型训推一体服务。
此次发布,百舸4.0在集群创建、开发实验、模型训练、模型推理等方面均进行升级,覆盖企业使用大模型的全流程,在诸多企业用户重点关心的指标上带来大幅提升。
具体升级内容可参考:
其次来看大模型平台千帆,它主要为企业提供生成式AI生产以及应用全流程开发工具链。
千帆大模型平台3.0在应用开发层、模型服务层和模型开发层全面升级。
应用开发层,千帆大模型平台3.0全面支持企业级RAG和企业级Agent开发,同时发布了端到端应用开发工具AI速搭。
企业级RAG支持不限容量知识库存储,速度上能达到1.5秒内返回结果。RAG全部环节包括解析、切片、向量化、召回、排序等,都可调可控。企业可以灵活配置出适合自己业务的方案。
澎湃新闻基于千帆企业级RAG,能够快速从庞大媒资库中准确检索内容。可以很好避免大模型幻觉问题,能够让企业放心使用大模型在自身生产环境中检索、回答的结果。
企业级Agent是另一种常见大模型落地方式。它能让大模型进行自主思考和任务拆解,并调用工具去全流程自动完成任务。
企业级Agent支持文心系列以及百度各种垂类模型,并进一步提供百度搜索、百度地图等官方组件支持,另外也支持长短期记忆能力,让Agent可以记住和用户的对话内容。
比如让Agent制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。
可以看到Agent能在不同APP之间跳转操作,像人一样在做任务的分解、规划和执行。
AI速搭则支持一句话搭建应用。通过聊天或者上传PRD的方式来生成应用,可以零代码方式生成资产管理、CRM等企业级应用。
过去几个人几天才能搞定的应用开发,现在通过对话方式,以分钟级速度就能完成。不懂开发的业务人员也能轻松上手。
而且还能以自然语言对话方式修改需求、增减模块。
目前通过千帆大模型平台开发的的应用数量已经超过70万。
好用的应用开发需要好用的模型提供基础能力。
千帆模型服务层提供丰富大模型,覆盖大语言模型和传统模型。
因为在实际落地中,传统NLP、CV模型仍旧有很多市场需求,大小模型混用的模式很常见。
所以千帆大模型平台3.0进一步丰富了可使用模型。主要包括百度自研的文心系列,以及新增语音系列能力模型和视觉系列模型。
千帆大模型平台3.0可提供模型如下:
模型开发层提供最全面的工具链。
包括DPO、KTO等模型训练算法和PTQ等模型量化算法,能够高效支持超大规模模型微调和定制。
还支持CV、NLP、语音等传统模型开发,实现数据、模型、算力资源的统一纳管和调度,为企业提供一站式的大小模型开发体验。
最后来看AI应用层。
云智大会主要带来了3款AI应用产品更新。
客悦此次升级了多模态交互能力、多语言能力和端到端洞察能力。仅需3步就能建立一个智能客服。
支持视频、音频、图文输入的多模态交互客服体验,可以让一些难以描述的问题更容易被解决,比如用户可以拍下仪表盘照片直接询问。同时支持中英文文档问答。
引入的大模型客服洞察Agent可以分析用户反馈用户对话过程,通过意图理解、关键信息抽取、情感抽取等,可以进一步帮助企业了解客户,如宝马领悦、通用中国等都已用上这一能力。
曦灵4.0在能力提升的同时成本进一步下降。
它现在支持小时级生成2D人像超拟人数字人、一句话生成3D数字人(10分钟)、替代真人视频播报、实时交互对话、直播等能力。
同时2D、3D数字人的应用成本进一步下降。只需199元,即可定制3D超写实数字人,价格从万元级别直接降到百元级别。
同时还提供开放的数字人组件平台,AppBuilder可接入,支持轻量级SDK和标准化接口助力快速集成。
现在,通过小程序,人人都能构建自己的数字人。
文心快码(智能代码助手)集成大模型技术,可以提供实时推荐、代码生成、代码审查、优化代码等能力。
此次发布了企业级代码架构解释、企业级代码审查能力和企业级代码辅助能力。
其中,企业级代码架构解释能让大模型快速解读代码库,梳理整个业务逻辑以及工程架构。程序员接手项目后就不用再逐行看代码,可以更快速清晰建立理解。
企业级代码审查能力解决了传统code review的问题。大模型参照以往企业私有代码和知识,可以直接替代人类审查代码内容,提高整个代码研发的效率和规范程度。
企业级辅助代码则能基于以往私有代码和知识库,能让AI编程更贴近于企业自身业务场景。
它能通过快速学习企业过往代码与规范,使生成的代码更符合企业要求。目前,文心快码已经服务超过1万家企业客户,帮助数百万中国开发者提升编码效率,整体提升研发效率20%。
总结来看,百度智能云这波大升级,方方面面都是以企业实际落地需求为核心,覆盖底层基础设施、模型能力及工具、上层AI应用全栈技术能力。
为啥如此旗帜鲜明all in“落地战”?
因为大模型应用到了全面爆发的时刻。
在此前的活动中,百度副总裁谢广军曾将大模型应用趋势划分为三个阶段。
第一阶段是ChatGPT刚刚诞生后,第一批想要接触大模型的企业开始囤积算力、尝试训练模型,带火了整个行业的算力需求。
第二阶段是从去年下半年到今年年中,开发者们开始在基座大模型上探索AI原生应用开发,开始探索生成式AI可以落地应用于哪些场景。这个过程中,大模型的渗透率非常高,“甚至比过去10年里AI在生产生活中的渗透都要广泛”。
到了今年年中,终于一些大模型应用跑了出来,能真正实际落地产生价值,由此也就到了第三阶段。
这三阶段的划分,可以基于千帆平台上文心系列模型的API调用量增长趋势作为参考。最新数据显示,百度文心大模型日均调用量超过7亿次,半年增长超10倍;在千帆平台上精调模型数量已超过3万个。
进一步参考行业数据,2024年上半年,大模型领域可统计到的中标金额约为9.38亿元,已经远超2023年全年大模型中标项目披露金额7.89亿元,行业增速非常明显。
其中,百度在主流大模型厂商中一举拿下三项第一:最多中标项目数量(17个)、覆盖最多行业(6个)、中标金额总数最高(9297万)。超半数央国企都在使用百度智能云进行AI创新应用落地。
对外披露客户中,不乏一些对大众日常生活都产生深远影响的厂商与企业。
比如三星Galaxy S24系列手机就深度集成了文心大模型,可以提供“即圈即搜”、一键总结长文、端侧AI实时语音转录等AI功能。
“即圈即搜”是三星Galaxy S24系列首创的AI能力,只需在屏幕上圈出/划出图像内容,即可联网进行搜索。
要知道,AI手机是当下领域内公认的趋势,也是将AI切实引入大众生活的重要载体。大模型对操作系统的影响,也将带来移动应用的二次爆发。IDC预计,2024年中国市场上搭载AI功能终端设备将超70%,AI终端占比将达55%。
智能汽车行业更是与AI具有与生俱来的联系。AI助手是智驾座舱内最流行的新趋势之一,也成为广大车主感受大模型趋势的重要媒介。
比如蔚来就基于千帆大模型平台,在文心大模型基础通过提示词工程打造了NOMI GPT。
它能提供更懂用户、更聪明、更万能的AI小助手体验。目前NOMI已经陪伴近20万车友家庭。
目前,百度智能云已在政务/智慧城市、交通、能源、制造、汽车、金融、泛科技、教育领域探索大模型应用落地场景。
那么问题来了——
拿下多个行业第一,百度凭什么。
其一,AI是百度的基因与内核。过去十余年在底层技术上研发积累,为百度模型自研、模型开发能力对外输出以及自身大模型应用落地提供坚实基础。
由此,百度逐渐构建了AI全栈能力,从底层计算平台到上层应用落地。尤其是大模型趋势到来后,百度快速针对趋势推出了面向行业的大模型平台和一系列行业产品,在大模型产品布局上处于国内第一。
其二,百度多年的AI落地经验和自身应用构建经验,也为大模型能力输出提供可靠参考。
最直接的例子就是千帆大模型平台对外提供丰富工具链,这些都是百度大模型开发经验的对外输出。百度副总裁谢广军也提到,他们希望企业用户能在千帆大模型平台上形成自己的数据飞轮,因为百度自身诸多业务就是这样运作的。
以及最新动向中,百度察觉到大模型趋势激发千行百业拥抱AI的热情,但并不是完全舍弃传统AI。还有诸多企业存在大小模型混用、传统NLP/CV模型的需求,因此在千帆大模型平台3.0上进一步丰富这方面能力。
其三,百度智能云的百舸构建的异构算力体系,可以为行业提供更多元的算力选择。
尤其在大模型价格战的趋势下,“高效”、“充分”的底层算力,也能让百度进一步对外提供更具性价比的模型算力服务。
如上方方面面,共同构成了百度智能云的“多个第一”。
百度集团执行副总裁、百度智能云事业群总裁沈抖在云智大会上表示,过去的一年,是大模型从技术变革走向产业变革的关键一年。
大模型重构一切,为每个企业提供平等的增长机会。
人类历史上又一次生产力跃迁,正在加速发生。
正如蒸汽机之于第一次工业革命、发电厂之于第二次工业革命,计算机之于第三次工业革命,云计算基础设施是眼下第四次工业革命的“底层基建”。
与此前有所不同的是,智能时代下的基础设施,硬件设备只是重要构成之一,建立在算力之上的模型、工具链与应用开发工具,更是开掘智能时代“矿产”的重要工具。云智大会上,百度的最新亮相,正是这一逻辑的具体展开。
随着大模型更大规模应用落地趋势开启,智能时代底层基建的建设与发展也将进入新一轮加速期。
在这之中,百度智能云作为主力选手,已然做好全面准备了。
文章来自于微信公众号“量子位”,作者“明敏”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】Whisper是由openai出品的语音转录大模型,它可以应用在会议记录,视频字幕生成,采访内容整理,语音笔记转文字等各种需要将声音转出文字等场景中。
项目地址:https://github.com/openai/whisper
在线使用:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales