中国企业对于生成式AI应用场景的了解都来自于ChatGPT的传说,但中国企业能使用的GenAI资源与ChatGPT却没有关系。直截了当地说,中国企业目前能够使用的GenAI资源都比GPT-4要差很多,注意不是“有差距”,而是“差很多”,这是中国企业考虑生成式AI问题的基本前提。
但是,另一方面,GenAI
技术在快速发展,等到海外公开放出Llama3或Mistral2这样更强大的模型,国内公司“自主创新”后,中国企业就可以开始使用与GPT-4差距更小一点的模型。所以,详细了解ChatGPT等的应用场景,还是非常有必要的,因为这是中国企业目前可以想象的应用场景的上限,超过上限的想象就是幻想,趁早打住。了解上限在哪里,这也是中国企业考虑生成式AI问题的另外一个基本前提。
在这些前提之下,中国企业能否设想一些生成式AI的“应用场景”,投入生成式AI建设,进行概念验证和小规模试用测试。这样去推进生成式AI建设有没有问题?
如果中国企业是开放型的,可以“直接使用”现有GenAI产品,那么这个思并没有什么问题。先研究中国市场到底有哪些成熟的GenAI产品,然后选择市场最优秀的GenAI产品,先订阅或者试用,一段时间后总结应用成效,有实效就继续使用,无实效就停止使用。
但是,如果中国企业是封闭型的,对于GenAI产品只能进行“深度研发”或者“工程化适配”,这样就与“直接使用”的应用模式产生了巨大差别,此时仅仅考虑了一些“应用场景”就着手进行GenAI建设会产生非常大的问题。
原因就是,中国企业以“深度研发”或者“工程化适配”为基础的GenAI建设,对应着巨大的成本,不从业务用例和业务目的的层面把问题彻底想清楚,就动手GenAI建设,会造成巨大浪费。
以“深度研发”或者“工程化适配”GenAI建设,是包含着算力投资、数据费用、AI研发团队建设、提示词工程/RAG/精调的研发与维护、应用集成与业务整合等巨大投入的过程。
GenAI应用不是软件项目,不是“做完了”与“没做完”的问题,GenAI产品是个概率性产品,是关于有用性、准确性、合规性的综合性能问题,没有端到端的长期投入、维护和优化,实际上无法进行严肃的概念验证和小规模试用测试——“项目完成,能效不佳,等于废品,不如不做”。
因此,在GenAI建设之前,中国企业必须完全想清楚业务用例和业务目的,业务流中能不能纳入GenAI,纳入GenAI到底是为了增收还是为了节支,增收或节支能取得多少收益,增收或节支对于GenAI的性能要求是什么,GenAI建设成本和维护成本怎么规划——这个企业级的“GenAI决策模型”必须首先建立起来。
一些决策者可能对此会有疑惑,“应用场景”不就是“业务目的”吗?一个“应用场景是有益的”不就等于是“业务目的是成立的”吗?软件项目可以这样做,GenAI应用为什么不能这样做?
大部分中国企业的软件开发确实就是以“应用场景”为导向的,需求分布式提出、开发分布式交差,造成企业里充斥着数量极大的散乱小软件系统,只不过在这种分布式架构之下,浪费也是分布式,浪费在时间和空间上都被分散了,企业感受不到巨大浪费而已。
以“业务目的”为导向的软件开发,就是要从企业业务架构出发先考虑企业软件架构的问题,先有顶层业务流、数据流的设计,再有软件开发。当前生成式AI的技术发展,正从AI Copilot的第一阶段转向AI Agent的第二阶段,AI Agent则是在直接重构企业核心业务流,企业不首先理顺企业软件架构问题,未来会越来越难以回答“企业应该怎么用好AI”的问题。
大部分中国企业的实际情况是,已经充斥了以“应用场景”为导向的大量散乱小软件,这时就需要再来一次以“业务目的”为导向的软件大重组,这种软件大重组的另外一个名字就是——“数字化转型”。
但是,对于企业GenAI应用,“应用场景”为导向来开发是不可行的,先建设再转型都是不可能的。
N个“应用场景”都设计了GenAI应用,那么这N个GenAI应用互相是什么关系?N个GenAI底层的基础模型之间是什么关系?N个GenAI底层的算力池是怎么规划的?N个GenAI所依赖的数据基础建立了没有(这不是技术问题,是管理问题)?N个GenAI依赖的AI研发团队建设与工程化适配技术能力是怎么规划的?这些问题都是企业软件架构层面的问题,企业GenAI的技术特点实际上在逼迫企业必须先考虑好企业软件架构。
中国企业在根本没有想清楚“企业应该怎么用好AI”、“业务应该怎么与AI结合”的时候,最好不要急着去凑生成式AI的热闹,不要急着去当AI科研试验品,免得出现巨大浪费后不了了之。
文章来自于微信公众号 “阿隆随录”,作者“阿隆随录”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0