百模大战愈演愈烈,各大厂商卷出了不同形态:
有的大秀肌肉,在文本长度上一骑绝尘;有的与搜索等功能深度融合,成为了全能型AI助手……琳琅满目的大模型产品令人目不暇接。
但对于企业用户而言,尽管这些通用大模型各有各的特色,但在解决行业任务时,表现得却并非那么完美。
究其“不能胜任”的原因,主要是通用大模型在特定行业的知识储备并不充足,甚至存在严重的幻觉。
为了弥补这样的缺陷,需要大量的行业数据,模型算法也需要进行优化,而这又会牵扯出算力问题……
也是这种背景之下,为了帮助企业用户更好地实现大模型应用落地,浪潮信息提出了集算法、算力、数据和互联为一体的端到端解决方案。
随着人工智能技术的快速发展,AI正在变得无处不在,影响着各种计算设备和平台。
从服务器到个人电脑(PC),甚至是移动设备,AI算力正在渗透进每一个计算设备,面向人工智能的算力范式不断革新。
除了这种“一切计算皆AI”的大背景,人工智能的代表性产品——大模型也进入了2.0时代。
这意味着将会出现更大的模型,随之而来的是更多的数据需求,以及对算力资源的更大需求。
而算法、算力和数据正是人工智能发展的“三驾马车”,但从当今发展来看,发展得都不充分。
首先,由于大模型的训练成本极其高昂,导致试错代价极高,进而出现了在大模型时代对于算法的创新依旧有所保守的局面。
算力的资源也并不均衡,北京智源研究院副院长兼总工程师林咏华认为,大模型2.0时代,不能只关注单颗芯片的能力,而是需要考虑从芯片到服务器集群,再到数据中心的存储和计算关系,以及整个网络的协同。
数据方面的情况一样不乐观,随着大模型对计算规模的需求增加,人类产生的已知数据,对于大模型而言即将甚至已经不足。
除了大模型自身发展受到算力和数据等方面的桎梏,对于企业用户来说,大模型落地还存在更多的现实问题。
一是大模型缺少专业的行业数据,不可避免地导致了幻觉问题,难以适用于企业场景。
另一方面,有些企业应用场景中,对模型窗口长度需求极大,现有的模型可能无法满足需求。
此外,开发难度大、技术门槛高,也是企业实现大模型落地的一个重要壁垒。
想要解决这些痛点难点,需要从上到下的整个生态为之发力,而浪潮信息正是企业大模型落地助推者中的一份子。
第十届IPF浪潮信息生态伙伴大会上,浪潮信息AI软件研发总监吴韶华隆重发布了企业大模型开发平台元脑企智EPAI。
EPAI平台提供了端到端的企业大模型落地解决方案,解决了企业大模型应用开发流程复杂、门槛高等困难。
大模型2.0时代,数据就是资产,掌握数据就等于掌握了话语权。
而EPAI提供了上亿条基础知识数据,同时还包含了自动化的数据处理工具,可以帮助用户整理行业数据和专业数据,生成高质量的微调数据和行业/企业知识库,进而打造企业专属数据资产。
有优质的基础+行业+企业数据作为支撑,大模型生成内容的准确性和可靠性就有了保证,幻觉问题将大幅缩减。
同时,结合检索增强生成(RAG)技术,EPAI可以解决企业知识库更新频率高但大模型微调耗时长、频率低的矛盾,保证模型能够及时获得处理最新知识的能力。
另一方面,EPAI还提供了高效的微调工具,支持千亿参数模型面向产业知识的快速再学习,并让模型具备百万Token的长文档处理能力,解决窗口长度不足的问题,快速打造领域大模型。
好马当配好鞍,EPAI不仅拥有强大的企业大模型开发功能,在易用性方面也帮助开发者降低了使用门槛。
使用方式上,EPAI支持API、对话UI和智能体三种使用方式,可以面对不同的业务场景需求,并让不同技术水平的开发者都能拥有与自己能力相匹配的开发方式。
甚至是非专业开发人员,也能在几天培训之后快速掌握平台的使用方法,摆脱专业知识的限制。EPAI实现了大模型应用开发的普及化,降低了企业的用工成本。
吴韶华举例说,假如要开发一个“智能编程助手”,即使是经验非常丰富的工程师可能也需要两到三周的时间,但用了EPAI,可以非常快速地执行。
而且EPAI既支持包括CPU和各种GPU在内的多元算力,又支持包括自研的“源”大模型和其他主流开源、闭源模型,适配快,迁移成本低,为企业提供了丰富的模型和算力选择。
此外,企业用户最担心的数据安全问题,EPAI也提供了坚实保障,通过权限管理、数据加密、内容审查等多种技术手段,确保数据和模型安全,做到了隐私信息不泄露。
相较于其他开发平台,浪潮信息的一个独特优势是,从“左手”的算力、模型等底层技术提供者,到“右手”的各行业软件开发商,都是浪潮信息生态中的伙伴。
这意味着,EPAI平台可以上承算力,下接应用,成为整个生态的“交通枢纽”,加速面向应用的快速创新。
EPAI为企业用户很好地解决了算法和数据问题,但浪潮信息提供的支持不止于此,而是集算法、算力、数据、存储、互联为一体的全面布局。
在算力方面,面向越来越多的大模型推理场景,浪潮信息还联合英特尔发布可运行千亿参数大模型的AI通用服务器;存储方面,发布分布式全闪存储AS13000G7,解决大模型训练数据挑战;互联方面,发布国内首款超级AI以太网交换机 X400,加速大模型训练推理……
浪潮信息的这一系列布局,或将给大模型行业带来新的格局。
谈及EPAI平台的意义,吴韶华介绍到,EPAI平台提供的是工具箱和方法论,让用户可以尽可能地发挥自己企业的价值。
而且,EPAI平台将能够实现对于开发者的普惠,企业不必再花费大量资金构建一个高精尖的团队,也可以做起大模型。
通过EPAI和其所提供的方法论,企业用户可以从自己做起,掌握这样一套方法和工具,然后再去服务好、支持好他们行业的客户。
只有借助最适合、最高效的工具,让它在工作的时候拥有很高的效率和成功率,才能真正把产业快速地做大。
对此,浪潮信息高级副总裁刘军表示,EPAI“让我们看到大模型的另外一面,它的产业化落地的这一面”。
此外,EPAI对于整个产业的协作也大有裨益——
过去,恨不得每个人都想做大模型企业,都想自己从头彻尾都搞一套工具,但事实上不可能所有人都能把生意做大。
只有依靠优质的产业协作分工,大家都做自己最擅长的事情,形成多元多样化的、共同去促进的生态,才能让产业AI真正落地。
— 完 —
本文来自微信公众号“量子位”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner