ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
解码瓴羊:一群最懂数据的人如何让AI真正无处不在?
2261点击    2024-09-25 08:58


三年走来,每一步都「作数」。


懂场景者得 AI


短短一年多,全国已有 197 个 AI 大模型完成备案,行业大模型占比近 70%。伴随这一快速增长的趋势,一个现实问题不容忽视,如果不能和普通商家的现实需求紧密结合,大模型体验再好,也无法帮助大模型厂商自动完成商业闭环:


扎堆商场一楼的新能源车销量大不如前 ,如何让高昂租金的产出性价比更高?


某大型服装厂的数据表累积超过 3 亿多行,如果提炼不出价值,就只是成本;


因为数字转型做得早,一堆业务系统竖起的数据「烟囱」让某乳业大品牌进退维谷;


答非所问、反应滞后、人工客服难找,智能客服一直在挑战人的血压极限;


.......


算法是智力,算力是体力,数据是血液,「但让 AI 真正飞入寻常百姓家的关键,在于与具体场景的深度融合。」9 月 20 日,瓴羊智能科技(以下简称瓴羊)在 2024 云栖大会上举办了「 Data×AI :企业服务智能化,价值增长新动能」专场论坛,阿里巴巴集团副总裁、瓴羊智能科技 CEO 朋新宇在论坛发言中说道,归纳成公式就是「(无处不在的)AI =(算法+算力+数据)x 场景」。


「 x 」强调了两边元素的放大作用,一个是指 AI 带来的体验提升,至少要 10 倍好于过去,不然就只是一个外挂。另一面,即使拥有先进算法、强大算力和海量数据,如果不能与具体业务场景紧密结合,AI 价值也无从谈起。


卷场景:大模型掷地有声


瓴羊,作为阿里巴巴的全资子公司,今年迎来了它的第四个年头。看起来「年轻」,实际上资历很深,集合了阿里最懂数据的一群人,其中带头者朋新宇已经是一个在阿里工作了 20 年的数据老将,也是阿里巴巴数据中台的创立者。


瓴羊专注数据要素服务,推出了五大产品矩阵,覆盖了从底层数据治理到顶层业务应用的数据生命全周期。



最引人注目的是应用侧 ,分析(Quick BI)、营销(Quick Audience)和客服(Quick Service)三款产品涉及所有企业应用的「最大公约数」 ,也是企业预算最多、最易沉淀数据并与 AI 产生「 化反」 的业务场景。


第二层是数据侧,包括数据中台 Dataphin 和「瓴羊港」。前者负责企业数据治理工作,确保数据的质量、一致性和可用性,也容易与 AI 结合。后者像是管道,专注数据在企业外部的高效流通,为整个生态提供源源不断的数据活水。


至于基建侧,瓴羊定位自己是一家产品公司,因此年初看到 OpenAI 推出 GPTStore 时,团队没有太过纠结就做出决定,不去跟风「卷」大模型,坚定应用好大模型。


他们选择阿里通义千问作为通用底座,结合专业知识和行业数据,「炼出」不同领域的垂直小模型(如 BI 领域模型),将大模型能力「揉进」几款产品(Quick BI、Quick Audience、Quick Service 和 Dataphin),直接为客户创造价值。


商业智能(BI)工具是每一个迈向 AI 时代商家的标配,BI 技术也从传统 BI、敏捷 BI 逐渐进化到智能化 BI。敏捷 BI 时代,用户可以通过拖拽、点击更直观地与数据交互,随着大模型为 BI 引入革新性生成式分析体验,智能化 BI (如瓴羊 Quick BI )时代,原本高门槛的数据分析变得像对话一样简单。


智能问数(ChatBI)就是一个颇具代表性的例子,体现出自然语言到 SQL 的技术转换。该功能支持即席查询、覆盖关键问数场景,在复杂计算的兼容性、模糊语义识别方面,表现尤为优异,即使毫无技术背景,用户也能轻松对「数据」发问。


如电商平台销售场景中,想了解销售额大于1万的省份这类问题,就体现了智能问数(ChatBI)二次复杂计算能力


对于模糊语义的识别,当前智能问数(ChatBI)也能轻松识别并理解。如提问中「小郑」定位到「郑强」。


这种智能化的 BI 工具正在解决实际业务中的痛点。以某知名乳业品牌为例,其供应链管理面临两大难题。


一个是查询数据报表的灵活不足,固定报表一般按天甚至月计,满足不了灵活多变的业务需求。求数据开发人员,要等三天才能拿到报表。


另一个是人工报表搭建周期长,成本高,导致异常诊断分析复杂,缺乏多维度目标差异比对分析,「看板」只展示数据,还不能自动分析问题原因。


Quick BI 帮助客户在内部建立起智能问数体系,支持自然语言问询,无论是日常工作、业务会议还是出差途中,业务人员都能快速获取数据、检索资产,还能进行丰富的指标分析。


由于结合了传统统计算法和大模型,Quick BI 可以深度解读图表和补全信息,揭示业务数据背后故事,高效定位原因,真正辅助商家作出决策。


而在营销领域,随着移动互联网用户和流量见顶,企业相关预算分配更加谨慎,从「种草」走向「转化」,更看重 「确定性机会」。


以某床垫品牌为例,线上渠道有 9 个,线下门店多达 5600 多家,如何定位「正确的人、在正确时间,说正确的话」,提升转化率?「双 11 」大促,用什么办法激活老会员复购?不少商家苦于平台「沉睡人群」即将流失,却无有效抓手叫醒他们。


现在借助大模型,瓴羊 Quick Audience 的「门店智能营销助手」 可以快速「圈定」目标用户,缩短营销创意时间,并优化沟通时机,显著提高触达率。


例如,某知名服饰品牌天猫平台的「沉睡人群」即将流失,商家借助 Quick Audience 迅速「圈定」北京、上海、广州共 42 家门店 5 公里内常驻或工作的「沉睡人群」,在预测设备活跃时刻推送瓴羊超信,实现目标人群的线下门店召回,到店率提升 18% ,线下转化率提升 35% ,全渠道转化率提升 40% 。


而 Quick Audience 的另一个新功能「智能采集分析助手」成功将数据团队从数据采集(「埋点」)这种典型的 dirty-work 中解放出来,以全自动、可配置的方式,一站式完成埋点采集及业务分析应用。


某头部车企,供应商采集埋点开发成本高,周期长,质量把控困难,通过使用智能埋点助手,节约供应商埋点开发人力采购成本 9 成,项目实施周期缩短 50% ,埋点相关数据故障降为 0 。



除了分析、营销场景,当前,智能客服也存在诸多不足,如常常答非所问、维护知识库仍靠人海战术、一线客服效率低下,导致客户投诉频发。为此,瓴羊 Quick Service 2.0 借力大模型,有效解决了这些不足。从效果上看,解答准确率提升至 93% ,人工客服处理问题所需时间从 10 分钟缩短至最快 5 秒,知识库部署所需时间从 7 天缩短至 5 分钟。


卷数据:从治理到流通


除了利用 AI 大模型重构分析、营销、客服三大企业级智能应用,负责数据治理的中台 Dataphin 也迎来最大变化—— 加入了 DataAgent 。现在,只需三步,就可以构建企业专属的数据资产智能体,这也是业内首个场景化智能找数方案。


建立企业数据资产全景和目录是 Dataphin 主要能力之一,现在,借助大模型,将企业数据资产目录构建为一个智能知识库,通过对话就能快速摸清「家底」,还能帮助用户快速定位业务相关数据资产。在个性化数据分析能力上,现在可辅助自动生成 SQL 代码,可链接即席查询和 BI 分析执行看数。



其实,在瓴羊成立之初, Dataphin 就已经经过阿里巴巴和众多企业的实践磨砺,被成百上千的客户应用,它的诞生直指当前中国企业在数字化转型过程中面临的首要挑战:数据「脏乱差」。


如台州银行在数智化升级之前,存在数据标准缺失、指标口径不统一、缺失统一清晰的数据资产盘点等问题。类似的问题也出现在其他行业,如某大型服装企业的营收金额统计,需要计入商场扣点、财务扣税等因素,因为各渠道数据口径不统一,每日的营收数据竟会出现高达数十万元的偏差。被企业视为经营压舱石的「四率二效」指标也因流程不规范,掺杂了各利益方的主观意愿。


而 Dataphin 通过标准化数据处理流程,统一数据口径,并提供全面的数据资产管理,帮助企业建立起可靠、一致的数据基础,为数字化转型铺平道路。Dataphin 最初源于阿里这个「超级工厂」的实践经验,因此在推广初期,瓴羊主要将其引荐给了与阿里规模相当的大型客户。


为了让更多企业能够用上好的数据工具,治理好数据,瓴羊针对性地进行了一系列改进,如针对私有化部署高成本和公共云标准化限制的痛点,Dataphin 通过重构治理方式,提供半托管服务,将部署时间从几天缩短到 1 小时,同时保持了个性化服务。



过去两年,瓴羊在数据领域取得了显著进展,不仅针对数据治理这一企业常见难题持续迭代升级 Dataphin 产品,还针对数据数量和流通这一更具挑战性的问题,推出了数据流通枢纽——瓴羊港。


数据不仅具有使用价值,还蕴含着巨大的交易价值。然而,如何让数据像淘宝上的标品一样高效流通,成为了一个亟待解决的问题。恰逢其时,2023 年 10 月 25 日,国家数据局正式揭牌,为数据流通提供了政策支持。「以数据促进融合发展」成为这家新机构的核心思想之一,而数据流通正是破解数实融合发展堵点的关键。


朋新宇敏锐地观察到,相比于前几年出于安全考虑而「踩刹车」的政策导向,国家数据局的成立有望起到数据「发动机」的作用,驱动企业间的数据流通。顺应这一趋势,瓴羊在 2023 年云栖大会上推出了瓴羊港,旨在破解企业长期面临的数据缺失、数据资产难以管理、外部数据无法融通等关键问题,提供「寻、买、管、用」一站式数据服务,帮助企业实现数据驱动的业务增长。


瓴羊港发布近一年,已达成和 30 多家头部数据方的紧密合作,目前平台上流通的应用场景和行业标签多达 3000 多种。



2022 年爆发的 AGI 革命无疑是计算机科学的又一次重大创新,标志着第四次工业革命的开端。在这场革命中,数据的规模、多样性和质量的战略重要性被提升到了前所未有的高度。


十余年前,阿里云抓住了云计算的技术浪潮。如今,瓴羊又踏上了数据要素浪潮。成立之初,瓴羊就明确将自身定位为 DaaS(数据即服务)公司,与传统 SaaS 公司划清界限:


SaaS 主要通过工作流程标准化来提高企业运营效率,解决的是效率问题。而 DaaS 则通过数据流的全场景应用,将数据价值渗透到企业经营的方方面面,致力于解决更深层次的业务价值问题。


面对未来十年的机遇与挑战,瓴羊如何才能领头羊群,成为海量商家生意增长的数智化参谋?朋新宇引用了团队内部坚信的价值观作答,不论是过去的互联网,今天的 AI ,还是未来的新兴技术,要真正落地到产业和企业,必须做到三点:


你要「快」,但「快」——很快看一篇论文、发表一篇论文,不一定解决所有问题;同时,你要「深」,深入理解行业痛点,要问客户能不能用?第三,客户要「认」,赢得客户的好口碑,前面的「快」和「深」才有价值。


文章来自于微信公众号“机器之心”,作者“吴昕”


关键词: AI , 模型备案 , AI BI , AI数据分析
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file