# 热门搜索 #
搜索
完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗
2848点击    2024-07-19 16:02

「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」



什么,这些同事竟然都是大模型驱动的 “数字人”?


只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。


就像这样:



像这样:



这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到 “立等可取”,而且生成的数字人能够直接应用于实时交互。据业内人士介绍,这在全球尚属首次。


同时,新技术仍旧保持了超高清标准,栩栩如生:



基于这项全新的 Z-XNR 技术和 TTS 语音大模型的融合框架,小冰数字人实现了秒级数据高质量形象声音复刻。独特的数据训练和推理算法,同时实现了数字人复刻高质量、视觉个性化表达与立等可取的便捷性:



不仅如此,小冰 AI 数字员工产品线这一次共计进行了三大升级:全新 Z-XNR 技术 + 全新超千亿大模型基座与 Agent 构建框架 + 全新透影音画传输系统。



全新超千亿大模型基座与 Agent 构建框架,简单而言,就是基于超千亿大模型基座,升级混合基座架构的 Agent 构建框架,搭建完整的交互数字员工能力构建与强化平台 —— 数字大脑平台,小冰全系列数字员工都能配备强大和丰富的职业交互套件,让数字员工更懂客户,更懂企业知识与业务,让交互精准适配商业场景原生工作流。



全新透影音画传输系统,是指基于 webRTC 的自研引擎,提供超高清视频推送能力、通信运营商级别的高质量低延迟的音画传输和弱网抗丢包通信能力,实现精准的声音画面同步,并可搭载透明通道数据,支持客户端实时渲染来丰富扩展应用。可以承载端到端的多模态实时交互和 AI 对话等场景,提供流畅自然的用户体验。


“零样本” 数字人以及基于该技术的全新普惠型数字员工的推出,进一步丰富了小冰 AI 数字员工产品线,产品体系 “高 - 中 - 低” 搭配日臻完善,广泛适配企业不同发展阶段和多样化的业务场景。目前,小冰的客户已经覆盖了包括招商局集团、红杉中国、万科集团在内的国内众多行业头部企业,并在各垂直领域企业中取得了丰富的产业落地实践。



而有了 “零样本” 数字人,更多的小微企业、小型商家,都有了更加便捷和低成本的路径来尝试数字人和大模型技术,有助于实现数字化转型。


至于如何体验?


即日起,通过小冰数字员工 APP 的自助服务,就可以轻松畅享全流程自动化的 “零样本” 数字人定制了。


值得一提的是,小冰大模型以及语言模型算法、语音合成算法、数字人合成算法等技术都已经成功通过了国家网信办备案,标志着小冰在技术能力、专业性、安全性和合规性方面拥有坚实基础,已获国家权威级认可。


近几年来,数字人如雨后春笋一般涌现,一度成为各行业的宠儿。然而,热度持续提升的另一面,日新月异的技术更迭、用户体验的更多诉求,都在向这一新兴赛道发起挑战。最近,市场逐渐回归理性,行业开始更加关注数字人的实际应用和商业价值。


作为最早布局数字人的企业之一,小冰团队一直走在 “数字人 + 大模型” 产品技术革新的最前沿。依托小冰大模型、神经网络渲染及超级自然语音等领先技术,小冰公司已构建类型丰富的 AI 数字人完整产品体系,将数字人的整体自然度提升到与真人难以分辨的程度,同时实现 800 毫秒级别的端到端超低延时人机实时交互,通过完备的 SaaS 化平台工具,用户可自主管理数字资产,配置数字人工作。目前,小冰数字人已成功赋能金融保险、智能车企、地产、文旅、政务、教育、零售、大消费、互联网等十余个垂直领域。


小冰团队表示,坚信技术创新的力量,将坚持致力于推动数字人普及,让数字人赋能千行百业,发挥技术进步的巨大价值。


文章来自于微信公众号“机器之心”,作者 “机器之心”


关键词: AI , AI数字人 , AI员工 , 小冰AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md