生成式AI初创公司Anthropic日前获得了新一轮融资,亚马逊、谷歌等科技巨头已在其投资名单。此举背后的重要原因在于,生成式AI企业训练大模型,或者提供给最终用户使用的AI产品方案,都需要算力资源,而调用算力的主要来源可以是买卡、自建私有机房,也可以是分布式云的、容器、Serverless等云上资源。后者的好处显而易见:对于AI初创公司,需要将更多精力投入在业务效率上,从长远来看,还有业务规模化后的稳定性和弹性收益等等。
不只是这些备受关注的AI企业。钛媒体App注意到,在中国用户市场,在GPU算力紧缺以及基础大模型尚未得到足够提升的背景下,过去一年,还有一些新业务团队,在尝试通过云上资源构建生成式AI的场景应用。
2023年2月,西门子中国大禹团队(负责IT数据分析与人工智能)认识到,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。出于企业战略考虑和具体业务需求,能不能从根本上提升知识库的可用性,构建一个基于大数据库和生成式AI的全新“智能知识库”?
三个月后,基于新架构设计的智能会话机器人“小禹”正式在全公司发布。实测结果显示,“小禹”的回答内容不仅生成速度更快,对搜索关键词的命中率更高,整体使用体验也得到提升。同时,还解决了各业务部门之间需求相似、重复开发问题,对系统在运维和扩展的投入成本实现了集约化。
这一成果的背后是来自于亚马逊云科技的支撑,除了采用当下流行的检索增强生成RAG架构、向量数据库等生成式AI技术外,还有Amazon OpenSearch Service分析服务和Amazon SageMaker机器学习服务等产品。投人、投技术、投专家伙伴,大禹团队还期待与亚马逊云科技进行更多共创。
本月初,亚马逊云科技宣布了几项新功能,其中包括:全托管生成式AI服务Amazon Bedrock正式可用,并新增接入Amazon Titan Embeddings模型和Meta Llama 2模型,AI编程助手Amazon CodeWhisperer发布定制新功能预览, Amazon QuickSight发布生成式BI新功能预览。
值得一提的是,Amazon Bedrock提供了企业构建生成式AI应用程序所需的一系列功能,能够在实现简化开发的同时确保隐私性和安全性。目前Amazon Bedrock提供给开发者可供选择的基础模型库正在扩大。目前已接入的AI公司大模型包括Anthropic C laude2,Stability AI Stable Diffusion XL,AI21 Labs Jurassic- 2,Cohere Command,加上最新接入的Meta Llama 2,以及亚马逊自研的Amazon Titan,共六种大模型。通过Amazon Bedrock,企业无需进行底层资源部署和管理,可直接调用这些基础模型,使用自身专有数据实现模型定制。
例如,沐瞳科技正在试用Amazon Bedrock,用于优化游戏开发领域的业务流程。在工业领域,海尔创新设计中心利用生成式AI能够实现文生图、图生图、定量图和全场景图四个方面的提效,上线后,自动化设计系统应用让相关业务的操作周期缩短了20%
金山办公在面向海外业务拓展过程中,计划将Amazon Bedrock服务集成到WPS海外版本进行生产测试,期待不同大模型组合在各类办公场景中带来实效。“现在没有一个模型能够解决所有问题,”金山办公AI研发总监刘强强调。
可以发现,面向中国市场,亚马逊云科技生成式A堆栈各个层面的能力正加速同步给B端企业用户。
10月24日,亚马逊云科技提出将为用户构建完整端到端生成式AI的技术堆栈,从五个层面展开:
选择合适的应用场景,从典型场景入手创新业务模式
借助专门构建的生成式AI工具和基础设施,快速构建高性价比的生成式AI应用
夯实数据基座,使用私有化数据,打造差异化竞争优势
云原生服务,加速AI原生应用构建,助力业务敏捷创新
使用开箱即用的生成式AI服务,消除重复性工作并专注创新本身
“生成式AI本身就是云原生的技术,只有云技术能让生成式AI落地生根。云计算本身是企业去运用生成式AI最好的方式。作为一家云基础设施提供商,亚马逊云科技定位于技术普惠化,我们希望通过技术解决大部分客户痛点,并快速降低客户使用门槛,帮助客户取得业务成功。”亚马逊云科技大中华区产品部总经理陈晓建对钛媒体App等指出。
在陈晓建看来,生成式AI不仅仅是大模型,同样需要加速芯片、数据库、数据分析、数据安全服务等服务作支撑。从底层的加速层如加速芯片、存储优化,到中间层模型构建工具和服务,再到最上层的生成式AI相关应用,每一层技术栈的创新都在解决客户需求。
不过,据钛媒体App观察,在下半年以来百度等企业同行的战略描述中,开始将更多落脚点放在与具体行业、垂类场景结合方面。而在高调宣布或对客户的承诺中,包括底层基础设施、平台、工具链、数据集等AI技术栈的“全面性”,谁也没有比谁的更差。
相反,从实际公开的企业案例和应用成果方面,比如走在AI应用前列的金融、电力等行业客户,已经将大模型作为探索自身业务高效发展的重要方向。
如何不让生成式AI的企业实践变成空中楼阁?如何塑造有价值的未来?
陈晓建提到一点:“在这个阶段去评价现在我们做得好还是不好,并不是非常重要,而更重要的是能够快速地去了解这个行业、了解客户的诉求,包括我们自身能力的具备。”
至于谁能够最先获得客户市场的信赖?结合当下市场环境来看,AIGC产业化仍然处于非常早期的阶段,价值和挑战同样并存。而更多的挑战在于,算力紧缺、成本制约、商业变现,这或许也是几乎所有企业所面临的问题。
对于亚马逊云科技而言,面向中国市场,无论是基于出海企业和跨国公司提供服务,还是拓展新的业务版图,面临的市场环境会更为复杂,尤其是在安全合规方面,立场和所需采取的措施也会更加严苛。
整体来看,亚马逊云科技以往90%以上的产品都是从客户需求推导而来。在AIGC领域的竞赛,亚马逊云科技也在大力夯实基础,端到端地为客户提供构建生成式AI应用所需的各种技术堆栈,除了上述的全托管生成式AI服务Amazon Bedrock,还在持续升级Amazon Trainium和Amazon Inferentia等AI芯片,布局某些具有潜力的应用如AI编程助手Amazon CodeWhisperer。
可能将这些投入转变为所谓的业务收入或客户数量,还需时日,亚马逊云科技也在伴随客户和伙伴不断成长。正如媒体沟通中提及一个有意思的话题:Amazon Bedrock未来会不会接入基于中文语料库的大模型?
亚马逊云科技大中华区技术专家团队总监王晓野的回答是:“目前公开信息是没有的。但我们看到很多中国初创企业在做中文大模型,从产品努力的方向上,我们一定是帮全球使用中文模型的客户来降低门槛,提供更好的便利。”
文章来自 “钛媒体”,作者 杨丽
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI