人工智能正在根本性地改变人们与世界互动的方式。它为企业带来了新的机遇和挑战,许多企业希望从新兴的人工智能技术中获益。
生成式 AI 模型成功地从多种来源进化知识,并利用这些知识来自动化任务,提升人类的创造力和生产力。
今天我们着重谈谈 Oracle 公司的 生成式AI 战略。
甲骨文的战略是围绕着企业借助三种不同模式(基础设施、模型和服务以及应用程序内)与 AI 工作的现实而制定的。--相比SAP,多了基础设施部分。SAP的AI战略可参考 AI重塑企业运营方式-SAP AI白皮书
1.高性能计算(HPC)
Oracle Cloud Infrastructure(OCI)具备高性能计算能力,能够处理复杂的深度学习任务,支持多 GPU 和多节点的配置,极大地提升了训练速度。
2.弹性扩展
OCI 允许用户根据需求动态调整计算资源,支持从小规模实验到大规模生产的灵活扩展。这种弹性使得企业能够在不同阶段有效管理成本和资源。
3.优化的存储解决方案
Oracle 提供了高性能存储选项,如 Oracle Cloud Object Storage,支持快速的数据读写和访问,确保模型训练过程中的数据处理效率。
4.集成的 AI 工具
OCI 内置了多种机器学习和 AI 工具,如 Oracle AI Platform,帮助用户快速构建、训练和部署 AI 模型。这些工具简化了数据处理和模型管理的流程。
5.安全性和合规性
Oracle 的云基础设施强调数据安全和合规性,提供多层次的安全措施,以保护用户的数据和模型,这对于处理敏感信息的行业尤为重要。
6.多样化的应用场景
企业可以利用 Oracle 的基础设施进行各种 AI 应用,如自然语言处理(NLP)、图像识别、推荐系统等,满足不同行业的需求。
Oracle 通过提供高性能计算、弹性扩展、优化存储和集成工具,建立了一个强大的基础设施,能够支持企业进行大规模的 AI 模型训练和部署。这使得 Oracle 在 AI 和云计算市场中占据了一席之地。
通过与 Cohere——一家为企业级大型语言模型提供领先的生成式 AI 公司的合作,他们启用了新的生成式 AI 服务和业务功能。
【注】
Cohere:Cohere 是一家专注于自然语言处理(NLP)和生成式 AI 的公司,提供强大的语言模型和 API,帮助企业在文本分析、自动化内容生成等领域应用 AI 技术。
Cohere 的语言模型可以与 Oracle 的云平台结合,为企业用户提供更强大的文本处理和分析能力。通过这种集成,用户可以利用 Cohere 的先进 NLP 技术,提升 Oracle 云服务的功能。
在客户服务、市场分析、内容生成等领域,结合 Cohere 的 AI 能力,Oracle 可以提供更智能的解决方案。例如,企业可以使用 Oracle 的数据库和云平台,结合 Cohere 的语言模型,进行客户反馈分析或自动化内容创建。
甲骨文计划将来自 Cohere 的生成式 AI 嵌入其 Fusion、NetSuite 以及垂直 SaaS 组合中,以快速生成为业务提供完整生成式 AI 力量的解决方案。
甲骨文的生成式 AI 产品覆盖了从应用到基础设施的范围,并提供了最高水平的安全性、性能、效率和价值。
目前,不同的云提供商都在推出生成式 AI 产品。但甲骨文最适合生成式 AI 的原因如下:
1.强大且高性能的模型
甲骨文利用其独特的数据和行业知识来为业务生成最佳模型。通过收购如 Cerner 以及借助一系列业务应用的经验,甲骨文训练了专属于垂直领域和行业领先的 SaaS 解决方案的专业模型。
【注】
Cerner Corporation是一家专注于医疗信息技术的公司,总部位于美国密苏里州的堪萨斯城,也是全球最大的医疗信息技术公司之一,和Epic等公司竞争,拥有庞大的客户基础,包括医院、诊所和医疗网络。Cerner不断投资于新技术,如人工智能(AI)、机器学习和区块链,以提升其产品的功能和价值,帮助客户更好地应对医疗保健的挑战。
Cerner在2021年被Oracle收购,成为其健康科技业务的一部分。这一收购旨在结合Oracle的云计算能力与Cerner的医疗数据管理专业知识,推动医疗行业的数字化转型。
2.无可匹敌的数据安全、隐私和治理
随着消费者使用自己的数据库来改进和训练预建的生成式 AI 模型,他们也信任甲骨文能继续全面保护其数据库。
3.嵌入式生成式 AI 服务
甲骨文正在跨其云应用组合(如 CRM、EMR 应用)集成并嵌入 AI。同样,他们也在数据库组合中提供生成式 AI 功能,就像之前在 Oracle 数据库服务和 MySQL HeatWave 中引入 ML 特性一样。
4.消费者随时随地可用的生成式 AI
消费者可以在甲骨文云基础设施上使用即将推出的生成式 AI 服务,并享受公共云带来的诸多好处,如按需付费、按需扩展、定制模型以及创建私有模型端点。
Oracle的创始人Larry 表示,在帮助公司开发生成式 AI 模型的云计算供应商中,甲骨文处于最佳位置,因为其第二代甲骨文云基础设施(OCI)使用了超高速远程直接内存访问(RDMA)网络,并且连接了英伟达 GPU 形成大规模超级集群,可以两倍于其他云的速度高效地训练生成式 AI 模型,并且成本不到其他云的一半。
RDMA(远程直接内存访问)网络意味着“网络中的一个计算机实际上可以在不打扰另一台计算机或使其中断的情况下访问该计算机的内存”。因此,它具有极快地在计算机之间移动大量数据的能力,速度比传统网络快许多倍。
RDMA(Remote Direct Memory Access,远程直接内存访问)是一种网络技术,它允许一台计算机上的设备(通常是网络适配器)直接读取或写入另一台计算机上的内存,而不需要经过中间节点的操作系统或 CPU。这减少了处理延迟,并提高了数据传输效率。
以下是 RDMA 的一些具体技术原理:
1.旁路操作系统:
在常规的数据传输过程中,数据包通常会经过接收节点的网络堆栈,包括网络接口卡(NIC)和操作系统内核。而 RDMA 允许数据直接从网络到达应用程序的内存区域,绕过了整个网络堆栈,从而减少了延迟并且提高了吞吐量。
2.专用硬件支持:
为了实现 RDMA,网络接口卡(NIC)必须支持 RDMA 协议,并且在主机上要有相应的 RDMA 驱动程序。NIC 中的硬件逻辑负责处理 RDMA 请求,而不是依赖主机 CPU 来完成数据的搬运。
3.内存注册:
在 RDMA 环境中,应用程序需要注册一段内存区域,这样 RDMA 网络设备就能识别这部分内存,并且可以直接访问它。这段内存被称为 RDMA 内存区域或者缓冲区。
4.多种通信原语:
RDMA 支持几种主要的通信原语,包括:
发送(Send)和接收(Receive):基本的数据传输操作。
读取(Read):允许一方直接从另一方的内存中读取数据。
写入(Write):允许一方直接将数据写入另一方的内存。
原子操作(Atomic Operations):保证即使在网络分区或系统崩溃的情况下也能维持数据一致性。
低延迟和高带宽:由于减少了中间层的介入,RDMA 能够实现非常低的延迟,并且提供高带宽的数据传输速率。
RDMA 技术非常适合需要高性能计算和低延迟的应用场景,比如数据中心内部的服务器间通信、分布式存储系统、高性能计算集群(HPC)以及最近越来越流行的机器学习和深度学习训练环境。
Larry指出,正是由于 OCI 的速度和成本优势,像 Cohere、NVIDIA 和 X.AI 这样的供应商正在使用它来训练它们的大规模语言模型(LLM)。他说:“在云端,时间就是金钱。”“Oracle 在训练 AI 模型方面比其他云更快,而且成本要低很多。”
除了 Cohere、NVIDIA 和 X.AI,以下是一些使用 Oracle Cloud Infrastructure(OCI)进行 AI 训练的其他公司:
1.ZoomInfo:
专注于市场情报和销售自动化,利用 OCI 的计算能力来处理和分析大量数据,优化其 AI 模型。
2.Myntra:
印度的在线时尚零售平台,使用 OCI 来增强其个性化推荐系统和客户体验分析。
3.Fiverr:
一个在线服务市场,利用 OCI 的 AI 算力来优化其平台上的搜索和推荐算法。
4.Électricité de France (EDF):
法国电力公司,利用 OCI 进行数据分析和机器学习,以提升其能源管理和预测能力。
5.Zebra Medical Vision:
一家专注于医疗影像分析的公司,使用 OCI 进行深度学习模型的训练和推理,以提高疾病检测的准确性。
6.Equinix:
全球数据中心和网络互联公司,利用 OCI 进行数据分析和 AI 应用,以改善其服务和运营效率。总结
Oracle 的 OCI 凭借其高性能计算能力和灵活的服务选项,吸引了多家 AI 公司,支持它们在模型训练和数据处理方面的需求。这些合作进一步提升了 OCI 在 AI 领域的市场地位。
Larry 还提到,生成式 AI 正在改变甲骨文自身如何开发新产品。
例如,他说道,甲骨文将继续支持用 Java 编写的旧应用程序,但如果需要编写新应用程序,则会使用基于开发者提示、由 GenAI 工具在 Oracle APEX 中自动生成的代码。“我们不再手动编写代码,而是生成这些代码。”他表示,“这从根本上改变了我们构建应用程序的方式,运行应用程序的方式,它改变了所有的一切。”
Oracle APEX(Application Express)是一种低代码开发平台,旨在帮助用户快速构建和部署基于Web的应用程序。以下是关于Oracle APEX的一些关键点:
1.基本概述
低代码平台:Oracle APEX允许开发人员和非开发人员使用最少的编码创建应用程序,降低了开发的复杂性。
基于Web:APEX应用程序可以在任何支持Web浏览器的平台上运行,支持跨设备访问。
2.主要功能
快速开发:通过可视化界面,用户可以拖放组件,快速构建用户界面和业务逻辑。
安全性:APEX内置了多种安全特性,如身份验证、授权和数据加密,确保应用程序的安全性。
集成性:APEX可以与Oracle数据库紧密集成,支持数据操作和分析,便于开发数据驱动的应用程序。
可扩展性:APEX支持与外部Web服务和RESTful API的集成,扩展应用程序的功能。
3.应用场景
内部管理系统:许多企业使用APEX来创建定制的内部管理工具和仪表板,帮助团队管理流程和数据。
客户关系管理(CRM):APEX可用于构建CRM应用,帮助企业管理客户数据和互动。
报告和分析工具:用户可以使用APEX创建动态报告和数据可视化工具,帮助企业进行数据分析。
4.优点
快速部署:使用APEX,开发周期显著缩短,能够快速响应业务需求的变化。
降低成本:由于其低代码特性,企业在开发和维护应用程序时可以降低人力成本。
易于学习:APEX相对简单,开发人员和业务分析师可以快速上手。
5.社区和支持
Oracle APEX拥有活跃的用户社区,用户可以在社区中分享经验、获取支持和访问资源。
Oracle APEX是一个强大的低代码开发平台,适合企业快速构建和部署各种Web应用程序。它结合了安全性、可扩展性和易用性,帮助企业提升效率和响应市场需求。随着数字化转型的加速,APEX在应用开发中的价值日益凸显
除此之外,就是Oracle的集成向量数据库,用于存储文档、图像和其他非结构化数据的语义内容作为向量,并使用这些向量来执行快速相似性查询。
这项新功能还将允许基于 Oracle 数据库和自治数据库构建的应用程序添加基于 LLM 的自然语言接口,让最终用户可以通过自然语言提问来获取他们所需的数据。
这种能力对于将甲骨文合作伙伴 Cohere 等开发的通用预训练 LLM 适配到如医疗和法律等特定上下文环境中是必要的。
接下来将是全球范围内争夺以最好、最经济的方式利用这项技术的竞争。根据Larry的说法,甲骨文在这个领域的客户和合作伙伴(包括 Cohere 和 NVIDIA)在速度和成本上已经占据了先机。
人类历史的下一个阶段即将书写。但就像好莱坞剧本的结果一样,我们不知道它将由人类作家还是由 GenAI 本身来书写。
文章来自于“技术驱动企业未来”,作者“曹乃刚”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI