ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
生成式AI的用云难题,其实才刚开始 | ToB产业观察
1348点击    2023-10-31 10:01

大模型军备赛中,云计算企业仍在持续行动。


生成式AI初创公司Anthropic日前获得了新一轮融资,亚马逊、谷歌等科技巨头已在其投资名单。此举背后的重要原因在于,生成式AI企业训练大模型,或者提供给最终用户使用的AI产品方案,都需要算力资源,而调用算力的主要来源可以是买卡、自建私有机房,也可以是分布式云的、容器、Serverless等云上资源。后者的好处显而易见:对于AI初创公司,需要将更多精力投入在业务效率上,从长远来看,还有业务规模化后的稳定性和弹性收益等等。


不只是这些备受关注的AI企业。钛媒体App注意到,在中国用户市场,在GPU算力紧缺以及基础大模型尚未得到足够提升的背景下,过去一年,还有一些新业务团队,在尝试通过云上资源构建生成式AI的场景应用。


2023年2月,西门子中国大禹团队(负责IT数据分析与人工智能)认识到,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。出于企业战略考虑和具体业务需求,能不能从根本上提升知识库的可用性,构建一个基于大数据库和生成式AI的全新“智能知识库”?


三个月后,基于新架构设计的智能会话机器人“小禹”正式在全公司发布。实测结果显示,“小禹”的回答内容不仅生成速度更快,对搜索关键词的命中率更高,整体使用体验也得到提升。同时,还解决了各业务部门之间需求相似、重复开发问题,对系统在运维和扩展的投入成本实现了集约化。


这一成果的背后是来自于亚马逊云科技的支撑,除了采用当下流行的检索增强生成RAG架构、向量数据库等生成式AI技术外,还有Amazon OpenSearch Service分析服务和Amazon SageMaker机器学习服务等产品。投人、投技术、投专家伙伴,大禹团队还期待与亚马逊云科技进行更多共创。


大模型需要在云上找答案


本月初,亚马逊云科技宣布了几项新功能,其中包括:全托管生成式AI服务Amazon Bedrock正式可用,并新增接入Amazon Titan Embeddings模型和Meta Llama 2模型,AI编程助手Amazon CodeWhisperer发布定制新功能预览, Amazon QuickSight发布生成式BI新功能预览。


值得一提的是,Amazon Bedrock提供了企业构建生成式AI应用程序所需的一系列功能,能够在实现简化开发的同时确保隐私性和安全性。目前Amazon Bedrock提供给开发者可供选择的基础模型库正在扩大。目前已接入的AI公司大模型包括Anthropic C laude2,Stability AI Stable Diffusion XL,AI21 Labs Jurassic- 2,Cohere Command,加上最新接入的Meta Llama 2,以及亚马逊自研的Amazon Titan,共六种大模型。通过Amazon Bedrock,企业无需进行底层资源部署和管理,可直接调用这些基础模型,使用自身专有数据实现模型定制。


例如,沐瞳科技正在试用Amazon Bedrock,用于优化游戏开发领域的业务流程。在工业领域,海尔创新设计中心利用生成式AI能够实现文生图、图生图、定量图和全场景图四个方面的提效,上线后,自动化设计系统应用让相关业务的操作周期缩短了20%


金山办公在面向海外业务拓展过程中,计划将Amazon Bedrock服务集成到WPS海外版本进行生产测试,期待不同大模型组合在各类办公场景中带来实效。“现在没有一个模型能够解决所有问题,”金山办公AI研发总监刘强强调。


可以发现,面向中国市场,亚马逊云科技生成式A堆栈各个层面的能力正加速同步给B端企业用户。



10月24日,亚马逊云科技提出将为用户构建完整端到端生成式AI的技术堆栈,从五个层面展开:


选择合适的应用场景,从典型场景入手创新业务模式


借助专门构建的生成式AI工具和基础设施,快速构建高性价比的生成式AI应用

夯实数据基座,使用私有化数据,打造差异化竞争优势

云原生服务,加速AI原生应用构建,助力业务敏捷创新

使用开箱即用的生成式AI服务,消除重复性工作并专注创新本身


“生成式AI本身就是云原生的技术,只有云技术能让生成式AI落地生根。云计算本身是企业去运用生成式AI最好的方式。作为一家云基础设施提供商,亚马逊云科技定位于技术普惠化,我们希望通过技术解决大部分客户痛点,并快速降低客户使用门槛,帮助客户取得业务成功。”亚马逊云科技大中华区产品部总经理陈晓建对钛媒体App等指出。


在陈晓建看来,生成式AI不仅仅是大模型,同样需要加速芯片、数据库、数据分析、数据安全服务等服务作支撑。从底层的加速层如加速芯片、存储优化,到中间层模型构建工具和服务,再到最上层的生成式AI相关应用,每一层技术栈的创新都在解决客户需求。


深入中国市场的挑战


不过,据钛媒体App观察,在下半年以来百度等企业同行的战略描述中,开始将更多落脚点放在与具体行业、垂类场景结合方面。而在高调宣布或对客户的承诺中,包括底层基础设施、平台、工具链、数据集等AI技术栈的“全面性”,谁也没有比谁的更差。


相反,从实际公开的企业案例和应用成果方面,比如走在AI应用前列的金融、电力等行业客户,已经将大模型作为探索自身业务高效发展的重要方向。


如何不让生成式AI的企业实践变成空中楼阁?如何塑造有价值的未来?


陈晓建提到一点:“在这个阶段去评价现在我们做得好还是不好,并不是非常重要,而更重要的是能够快速地去了解这个行业、了解客户的诉求,包括我们自身能力的具备。”


至于谁能够最先获得客户市场的信赖?结合当下市场环境来看,AIGC产业化仍然处于非常早期的阶段,价值和挑战同样并存。而更多的挑战在于,算力紧缺、成本制约、商业变现,这或许也是几乎所有企业所面临的问题。


对于亚马逊云科技而言,面向中国市场,无论是基于出海企业和跨国公司提供服务,还是拓展新的业务版图,面临的市场环境会更为复杂,尤其是在安全合规方面,立场和所需采取的措施也会更加严苛。


整体来看,亚马逊云科技以往90%以上的产品都是从客户需求推导而来。在AIGC领域的竞赛,亚马逊云科技也在大力夯实基础,端到端地为客户提供构建生成式AI应用所需的各种技术堆栈,除了上述的全托管生成式AI服务Amazon Bedrock,还在持续升级Amazon Trainium和Amazon Inferentia等AI芯片,布局某些具有潜力的应用如AI编程助手Amazon CodeWhisperer。


可能将这些投入转变为所谓的业务收入或客户数量,还需时日,亚马逊云科技也在伴随客户和伙伴不断成长。正如媒体沟通中提及一个有意思的话题:Amazon Bedrock未来会不会接入基于中文语料库的大模型?


亚马逊云科技大中华区技术专家团队总监王晓野的回答是:“目前公开信息是没有的。但我们看到很多中国初创企业在做中文大模型,从产品努力的方向上,我们一定是帮全球使用中文模型的客户来降低门槛,提供更好的便利。”



文章来自 “钛媒体”,作者 杨丽




关键词: AI算力 , Anthropic
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI