# 热门搜索 #
搜索
如何看待大模型驱动的BI变革
9081点击    2024-08-15 17:49

一要看大模型性能,二要确保数据分析的准确性。


在当前以数据为核心的商业环境中,商业智能(BI)工具已成为企业决策过程中的关键要素。随着技术的发展,大语言模型(LLM)作为一种新兴技术,正在逐步改变BI产品的传统模式,为企业决策提供更加灵活、高效的能力支撑。但实际应用场景中,企业对数据分析的准确性有着极高要求,只靠大模型能力远不能实现BI以数据驱动决策的服务目标。


想要以大模型驱动BI变革,一要看大模型性能,二要有效规避潜在的不可控因素,保证数据分析的准确性。


ABI 的关键价值由LLM的表现决定


据IDC统计,全球数据总量在过去几年中呈现爆炸式增长趋势。而数据量的增长不仅体现在规模上,数据的多样性与复杂度也在攀升,据IDC预测,到2027年,全球非结构化数据预计占到数据总量的86.8%,达到246.9ZB。面对数据体量与数据结构的巨大变化,传统BI显然难以满足以数据分析实现辅助决策的企业需求。


而随着大模型的能力提升与应用落地,其在BI系统中的协同价值正逐步被行业所认知:


LLM具备强大的数据处理能力和深度学习能力,能深入理解、分析数据及背后的业务逻辑,使革新后BI软件能在深入企业经营和业务运营分析方面进一步释放价值。在LLM的赋能下,BI软件能够提供更为准确和实时的预测结果,例如识别关键业务指标并及时向决策者发送警报,使企业能够更加快速地响应市场变化。


LLM在BI中的表现还在于提升用户体验。以LLM驱动的BI系统可以实现低成本的人机交互,用户可以通过自然语言查询,获取所需的数据分析结果,这使得非技术背景的人员也能轻松地使用BI工具,降低使用门槛的同时将由数据驱动的决策应用在企业更广泛的业务流程中。



图源来自:澜码科技


此外,在LLM出现之前,已有技术如NL2SQL在研究如何通过对话查询数据,但由于自然语言处理(NLP)技术的局限性,这些产品无法稳定可靠地生成查询SQL语句。随着LLM的发展,端到端的Text2SQL方案变得更加可行,尤其是在表结构相对简单的情况下,可有效地将自然语言查询转化为结构化的SQL查询语句。


但值得注意的是,在以人工智能驱动的商业智能(AI-driven Business Intelligence,ABI)应用落地过程中,其产品能力很大程度取决于AI能力,特别是大语言模型(LLM)的性能表现——能够在具备模型能力的同时查询到准确的数据成为ABI产品落地的关键与难题。


LLM之外,ABI产品还需要确保数据查询的准确性


与其它LLM应用相比,ABI产品在“准确率”方面有着更为严格的要求,数据是指引决策的核心依据,正确的结果是ABI产品的及格线。这就要求了面向企业用户的ABI产品需要有完善的机制,既要充分利用LLM的强大能力,又能有效规避其潜在的不可控因素,以确保提供的结果准确性。


理想的ABI产品应具备以下三个特点:


  1. 灵活的对话框架是保障ABI产品提供服务质量的关键要素。围绕数据查询、数据分析两个核心场景,通过对话框架进行适配,能够使得AI更好地理解用户的问题。这也进一步要求ABI产品同时具备多轮对话的记忆能力和上下文的理解能力,并且能够处理多样化的用户输入,包括文本、语音等形式。
  2. 完备的数据查询能力是ABI产品能为用户提供有效信息的基础。该能力要求系统能够快速、高效地访问和处理海量结构化与非结构化数据,这不仅包括传统数据库中的信息,还涵盖实时数据流、API接口等多种来源的数据。
  3. 专业的数据分析能力使得ABI产品能为用户提供有深度的见解。这包括对数据的深入分析、解读、异常检测等功能。此外,还要求系统能将复杂的分析结果,通过自然语言描述或数据可视化图表等简单、易懂的方式呈现给用户。



图源来自:澜码科技


但在企业应用场景中,以大模型驱动的ABI产品仍面临着数据结构复杂性、数据量规模以及非专业人员的查询习惯的挑战,能否成功应对这些挑战,也是衡量ABI产品能否取得成功的关键因素。


  • 数据结构复杂度的挑战。通常情况下企业业务具备一定的复杂性,这使得其业务数据表结构的复杂度大大提升,通常包含大量的表、字段、外键、索引和视图等。如何正确理解这些表之间的关系以及正确建立连接是一项很大的挑战。

  • 数据量规模的挑战。数据量的大规模增加会带来SQL查询性能的下降。而生成正确的SQL语句不仅要求语法正确,还需要考虑查询的性能和效率。错误的SQL语句可能导致长时间的查询或系统崩溃。

  • 非专业人员查数习惯的挑战。ABI产品赋予了用户通过“对话形式直接查询数据”的能力,这种创新的交互方式一方面带来了用户数量的增加,另一方面也需要面对“业务用户的非专业需求表达”的挑战。

非专业人员可能无法明确地表述他们的查询需求,或者在表达中掺杂了个人业务习惯和模糊不清的描述。在过去,这些需求通常是由专业的业务分析师(BA)进行解读和转化。而随着ABI的出现,它需要直面这一挑战。


上述挑战表明,单纯依赖LLM的能力,可能不足以全面解决企业所面临的所有问题,还需要确保ABI产品能够更精准地理解和响应业务场景的具体需求,提供更加全面和有效的解决方案。


数据分析的目的是指导企业的业务发展。基于数据分析形成有价值的业务发展建议,一直是数据分析产生业务价值中最难且重要的一环。


自然语言处理技术的进步使得AI Agent可以将复杂的分析结果转换为易于理解的语言或图表,帮助决策者迅速获取关键信息。


基于大语言模型的AI Agent能调用多样化的信息源,在跨领域的分析师及业务专家的知识赋能下,结合当下业务策略和动作,通过预训练和不断的模型调优,提供综合性的、更贴合业务、可行性更高的建议,真正实现数据驱动运营。


因此,以AI Agent为交互框架主体,将LLM、BI与产品结合,是实现ABI产品高性能的关键。


文章来源于“周健@澜码科技”



关键词: AI , 大模型 , AI BI , AI数据分析
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md