京东大模型品牌全新升级:JoyAI,Enjoy AI!
业界广为流传的说法是,大模型的上半场战事主要集中在找到模型训练的有效方法,从架构到参数、从单一语言到多模态大模型、从基础大模型到行业大模型……「卷生卷死」。而下半场的主流叙事则是找到可行方案,让模型切切实实地解决人们生活和工作中的实际问题。
无疑,现在已然进入下半场。比起在模型参数、性能的陡峭曲线上攀登,讲好大模型落地应用的新故事,似乎有更多的张力与想象力。
悄然之间,一场新的、围绕该如何让大模型技术更广泛、更深入地走进实际生活场景的突围赛拉开序幕。
而这种趋势,在今年的 WAIC 大会上彰显得更为明显。观众非常直观的一个感受是,相较于以往几届,不管是参展的技术、产品,还是各大论坛的讨论话题,这一届更为「务实」:各大厂商纷纷发力,秀起了大模型的触角是如何深入到产业更深的毛细血管处。
京东也是其中一家。
此次大会上,京东宣布旗下大模型品牌全新升级为「JoyAI」,跟千行百业一起「Enjoy AI」
京东集团高级副总裁、京东探索研究院副院长何晓冬表示,两年前京东大模型发布,彼时大模型主要聚焦语言。如今,经过两年发展、AI 技术不断突破,大模型走向更广阔的多模态领域,视频、图像、语音等等。期间,京东大模型也在持续进化。
据介绍,全新升级后的「JoyAI」拥有从 3B 到 750B 的全尺寸模型,涵盖语言、语音、图像、视频、数字人等多种模态,通过动态分层蒸馏、跨领域数据治理等创新技术,可实现「大而精」,将大模型推理效率平均提升 30%,训练成本降低 70%,轻巧部署,极速响应。
而 JoyAI 广泛应用更为直观的展示就在WAIC现场。从能高情商交互的人形机器人到企业高定的时尚数字人主播,从重塑企业工作流程的智能体搭子到低门槛、高可用的智能编码助手,每一个应用都在释放一个信号:京东「JoyAI」大模型正在加速让 AI 从实验室走向产业深度应用,且「无处不在」。
显然,京东 AI 已然迈进「深水区」。
在谈及 JoyAI 大模型的落地应用进展时,何晓冬提到一组数据。随着模型迭代能力提升、场景不断开拓,JoyAI 大模型已经在京东超过数百个场景广泛应用。
在刚刚过去的京东「618」期间,大模型调用量,相较于去年「11.11」同比增长超过两倍以上,约为 130%,百万级别的商家已经开始受益于京东 AI 应用,京东数字人服务的平台商超过两万家,深度融合大模型的京东智能客服,累计咨询服务量超过 26 亿。
如果说在WAIC看到了京东 JoyAI 大模型在落地应用上的广泛度,那这组数据直接言明了在产业上的纵深度,名副其实进入深度应用阶段。
摩根士丹利数据预测,到 2030 年,中国核心 AI 产业可能发展成为价值 1400 亿美元的市场。这意味着,在这片广阔的土壤中,AI 不再仅仅停留在辅助、镶边工具阶段,而是数量上大批量走向产业关键处,质量上高效解决问题,甚至带来显著收益。
一个典型的代表就是数字人。
从「小助手」到「C 位主播」,数字人真正实现「高商业可用」
数据显示,基于JoyAI,京东数字人率先成为大模型走向大规模应用的突破口,超 2 万家品牌常态化使用。而取得这样的成果,京东也只用了一年多的时间。
或许大家还记得去年 4 月份,京东集团创始人刘强东的虚拟数字人形象「采销东哥 AI 数字人」在全网进行多场直播,引起热议的盛况。热闹的背后,京东的数字人技术也得到了认可,之后团队不断收到商家投递而来的橄榄枝,连高奢品牌商都来主动寻求合作。
等到 2024 年京东「11.11」期间,数字人直接带动安踏直播间 GMV 突破 2000 万,公域成交 GMV 达 140 万 +,转化率 32.06%。
变化在悄无声息地发生着,直播间的数字人不再是吸睛博眼球、解乏逗乐的噱头,而是径直走向镜头中心,坐上「C 位」,带来扎实收益。
今年,京东数字人再一步进化,基于通用数字人大模型 2.0,京东新推出的高商业可用数字人,支持精品音色微调和更精准的声唇对齐,情感丰富的音色韵律,自然拟人的大姿态动作,适配场景的带货话术,让数字人表现力更丰富。
通俗来说,就是数字人的动作更为自然,更为适配主播人设,从体育达人到美妆博主、从高奢走秀到快消吃播,无论多么复杂、多变的商业直播场景,这批数字人主播都能够轻松应对。
「这款精华对油皮干皮都友好,夏天油皮轻轻挤两下……」「材质上甄选优质牛皮革,耐磨耐刮……」「这款坚果颗粒饱满,嚼起来很香……」
这样的数字人主播「带货」场景,在今年京东「618」期间常常上演,各大品牌直播间的数字人主播不仅在口头介绍产品,还能够上手测试,少了「AI 味」,多了人性化,俨然与真人主播没区别。
数据也显示,京东「618」期间,京东数字人带货水平超越市场上 80% 的真人主播。
值得注意的是,京东数字人背后的底层技术:「多模态交互式数字人关键技术及产业应用」,获得了中国智能科学技术最高奖 —— 吴文俊人工智能科学技术奖特等奖,这也是本年度唯一特等奖。
其实不止是数字人,如今大模型技术不断从单一模态走向多模态,走向真实世界,市场上各种人形机器人、AI 眼镜等智能终端产品层出不穷。京东也坚信,大模型将在实体世界中产生巨大价值。
为此,京东发布了一个全新的品牌 —— 附身智能平台 JoyInside。
JoyInside,为终端交互注入「有温度的灵魂」
据官方介绍,JoyInside 是一个具有海量知识、高情商、言行一致、长期记忆的大模型平台。基于该平台,可以将角色大模型驱动的对话智能体植入智能硬件载体,比如机器人、机器狗、玩具等,赋予这些硬件「灵魂」和「智慧」,提升产品竞争力和用户粘性。
可以设想这样一个场景:你新买了一个小玩偶,一般情况下,你只是把它摆在家里,时不时抱一抱、摸一摸,欣赏一下可爱的外表。可是假如有一天你可以和它对话,周末宅家想点外卖却不知道吃什么时问它的建议,它告诉你,你昨天吃了麻辣烫,或许可以再点一份,但要记得告诉商家少放辣;工作焦头烂额也想不出好的创意,向它倾诉,它告诉你,别着急放轻松,好的 idea 往往在不经意间来到……
听上去是不是很酷?
而这就是京东 JoyInside 与热门潮玩品牌 Fuzozo 芙崽在做的事情。通过接入 JoyAI 大模型,Fuzozo 芙崽可以实现高精度的情绪感知与拟人化反馈,言行高度一致,还具有长期记忆,从相知、相交到相伴,用户可以为自己「养成」一个贴心玩伴。
之所以能够实现这一功能,主要依托的是 JoyInside 背后的四大优势:
高情商对话体验:海量知识库支持,长期记忆能力,快速精准响应,让每次交流如沐春风;
多元场景适配:从娱乐教育到工业制造,从个人需求到企业应用,全方位覆盖多种场景;
海量角色选择:支持角色定制,涵盖人设塑造,声音风格个性化,打造专属于您的独一无二 AI 伙伴;
言行高度一致:准确理解对话过程动作意图,并驱动动作精准执行。
不仅是 Fuzozo 芙崽为代表的陪伴场景,据了解,目前已经有数十家企业正式接入了 JoyInside,涵盖了多种形态的具身智能体,包括以元萝卜 AI 下棋机器人为代表的教育场景,以及产业应用端的众擎人形机器人、云深处的四足机器狗等。
教育领域,元萝卜 AI 下棋机器人接入 JoyInside 后,集成知识辅导、英文对话等能力,通过沉浸式互动激发学习兴趣,人均对话轮次提升 148%。
而当下大火的人形机器人赛道,众擎人形机器人、云深处的四足机器狗在植入 JoyInside 驱动的 AI 角色后,不仅能完成基础动作指令,还能驱动机器人生成与语义内容高度协调统一的动作,显著提升产品表现力与竞争力。
大模型与具身智能是当下最火的两个领域,其中具身智能作为承载大模型技术的最佳终端载体,身价仍在持续水涨船高。有数据显示,2024 年,中国具身智能市场规模已经达到 8634 亿元,预计 2025 年中国具身智能市场规模有望达到 9731 亿元。
而今年也被称为具身智能量产元年,越来越多的机器人开始走向工厂,走向家庭。
何晓冬也表示,未来每家可能拥有一台人形机器人,机器狗数量或将增长三倍,机器人形态将更加多样,甚至出现大机器人带小机器人的场景,行业发展空间广阔。
面对这一广阔蓝海,包括京东、美团、阿里巴巴、腾讯在内的各大厂也在纷纷布局具身智能赛道。
最近的消息是,京东前不久密集投资了 4 家具身智能企业,包括已经接入 JoyInside 的众擎机器人,以及智元机器人、千寻智能、逐际动力。
而如今又官宣机器人「大脑」般存在的 JoyInside,可见,京东正通过「自研 + 投资 + 生态共建」的布局来深度切入具身智能领域。
据了解,京东现面向广大机器人、AI 玩具、智能硬件品牌开放附身智能招募计划,JoyInside 限时免费接入,不仅仅是大模型能力支持,还提供完整端到端的「软件 + 硬件 + 内容生态」一体化方案。现支持 SDK、盒子(即插即用模块)、API 三种灵活对接方式,京东还大力投入营销渠道与资源,持续陪跑品牌,共同打造下一款 AI 爆品,驱动新消费升级。
除了数字人和 JoyInside 这两个活跃在聚光灯下的领域,京东全新升级的 JoyAI 大模型,已然深入零售、物流、医疗、工业等诸多领域、数百个细分业务场景。
比如物流领域的仓内无人机、无人车等智能物流设施;工业场景下,AR 眼镜可以辅助产业工人精准质检并推荐维修方案;零售体验台前,系统自动个性化推荐商品、瞬间生成海量商品广告素材…… 即便是在那些不起眼,甚至不为人所注意的角落里,京东已经在用技术重塑生产力。
「落地」「深度应用」是 2025 年 AI 的主线任务,业界普遍认为时候到了,大模型技术不能再停留在实验室,要走出去,走向更广阔的产业界。
而不管是从具体的数据还是一个个鲜活的案例来看,一个明显的事实是,京东 AI 已经进入「深度应用」阶段。
但如果扒开仔细看,不同于很多先卷技术再卷应用的路线,京东的模型似乎本身就是「生」于产业、「长」于产业的。
比如,用 ChatGPT 引爆大模型时代,高举高打向着「AGI」进攻的 OpenAI,如今也在思考模型落地的方式方法。而京东早期既没有全力去卷基础大模型,也不是专门聚焦某一垂类大模型,从 2023 年开始推出大模型开始就是在走一条相对独特的道路:既做「大」也做「小」,力求通过 70% 通用数据和 30% 供应链原生数据,面向行业有实际需求的场景落地。
这既是由京东独特的供应链和产业场景决定的,同时也解释了为什么京东可以如此快速就进入「深度应用」阶段。
有数据显示,京东自 2017 年全面向科技创新转型以来,截至今年一季度,研发投入已累计达 1456 亿元,而这些研发都是直接面对内部供应链的各个环节、各大场景中的实际业务需求进行的。因此,京东大模型的技术演进路线图,也是京东在产业上落地应用的路线图,两者齐驱并进。
数据显示,目前京东内部已部署超 2 万个智能体,承担了企业超过 18% 的工作内容,覆盖外卖员招聘、财务管理等多个业务环节。
与此同时,各类大模型应用也深入到京东零售、物流、医疗等细分垂直的业务场景,为超过数十万的商家、快递员提供支持,明显提升了工作效率与服务体验。
而反过来,京东多年耕耘,积累了数量庞大、优质的行业数据,而这些数据则是来自京东内部零售、健康、物流、金融等数百个真实场景打磨过的。对于大模型来说,场景是「土壤」,数据是「养料」,基于此训练出来的大模型在推向行业界时,实用性更强。
所以,在京东 AI 已经全面渗透内部业务后,京东已经试着将 AI 的技术积累和能力向外释放。
此次 WAIC 期间,京东正式宣布开源 JoyAgent 智能体。
据了解,成长于京东自身业务系统的 JoyAgent 智能体, 既能高效解决通用问题,又能应对复杂商业流程,提供精准决策支持,主要具备三大核心特性:
100% 开源:京东云 JoyAgent 智能体,整体开源了智能体产品能力,开发者可以快速部署,拥有专属的企业级多智能体产品;
高可用性:平台预置了多种子智能体,支持 html、ppt、markdown 多种文件交付样式,搭配高并发 DAG 执行引擎,可以真正实现开箱即用,用户还可本地独立部署,使用更灵活;
更强性能:JoyAgent 智能体历经京东内部大规模场景锤炼,超 2 万个智能体实践,产品可靠性得到验证,在 GAIA 榜单准确率超过 75%,已超越众多行业知名产品。
不管是个人开发者、初创公司,还是企业级开发者,都可以「拿来即用」,帮助企业智能化升级。
实践是检验真理的唯一标准,好的 AI 不应该只停留在实验室里,要走出来,扎根于产业才知道好不好用。
而京东通过数字人、JoyInside 附身智能、JoyAgent 智能体平台等技术产品与平台,一方面是在展示自身实力,同时也是在将内部场景验证的能力转化为外部商业解决方案,形成生态扩张动能,促进整个产业加速走向更为智能化的未来。
正如何晓冬所言:「大模型的能力光谱在变、参数尺寸在变,不变的是让产业用好大模型,只有深耕产业,让大模型在产业里跑起来,才是最有价值的事情。」
文章来自于“机器之心”,作者“Youli”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales