「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」
什么,这些同事竟然都是大模型驱动的 “数字人”?
只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。
就像这样:
像这样:
这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到 “立等可取”,而且生成的数字人能够直接应用于实时交互。据业内人士介绍,这在全球尚属首次。
同时,新技术仍旧保持了超高清标准,栩栩如生:
基于这项全新的 Z-XNR 技术和 TTS 语音大模型的融合框架,小冰数字人实现了秒级数据高质量形象声音复刻。独特的数据训练和推理算法,同时实现了数字人复刻高质量、视觉个性化表达与立等可取的便捷性:
不仅如此,小冰 AI 数字员工产品线这一次共计进行了三大升级:全新 Z-XNR 技术 + 全新超千亿大模型基座与 Agent 构建框架 + 全新透影音画传输系统。
全新超千亿大模型基座与 Agent 构建框架,简单而言,就是基于超千亿大模型基座,升级混合基座架构的 Agent 构建框架,搭建完整的交互数字员工能力构建与强化平台 —— 数字大脑平台,小冰全系列数字员工都能配备强大和丰富的职业交互套件,让数字员工更懂客户,更懂企业知识与业务,让交互精准适配商业场景原生工作流。
全新透影音画传输系统,是指基于 webRTC 的自研引擎,提供超高清视频推送能力、通信运营商级别的高质量低延迟的音画传输和弱网抗丢包通信能力,实现精准的声音画面同步,并可搭载透明通道数据,支持客户端实时渲染来丰富扩展应用。可以承载端到端的多模态实时交互和 AI 对话等场景,提供流畅自然的用户体验。
“零样本” 数字人以及基于该技术的全新普惠型数字员工的推出,进一步丰富了小冰 AI 数字员工产品线,产品体系 “高 - 中 - 低” 搭配日臻完善,广泛适配企业不同发展阶段和多样化的业务场景。目前,小冰的客户已经覆盖了包括招商局集团、红杉中国、万科集团在内的国内众多行业头部企业,并在各垂直领域企业中取得了丰富的产业落地实践。
而有了 “零样本” 数字人,更多的小微企业、小型商家,都有了更加便捷和低成本的路径来尝试数字人和大模型技术,有助于实现数字化转型。
至于如何体验?
即日起,通过小冰数字员工 APP 的自助服务,就可以轻松畅享全流程自动化的 “零样本” 数字人定制了。
值得一提的是,小冰大模型以及语言模型算法、语音合成算法、数字人合成算法等技术都已经成功通过了国家网信办备案,标志着小冰在技术能力、专业性、安全性和合规性方面拥有坚实基础,已获国家权威级认可。
近几年来,数字人如雨后春笋一般涌现,一度成为各行业的宠儿。然而,热度持续提升的另一面,日新月异的技术更迭、用户体验的更多诉求,都在向这一新兴赛道发起挑战。最近,市场逐渐回归理性,行业开始更加关注数字人的实际应用和商业价值。
作为最早布局数字人的企业之一,小冰团队一直走在 “数字人 + 大模型” 产品技术革新的最前沿。依托小冰大模型、神经网络渲染及超级自然语音等领先技术,小冰公司已构建类型丰富的 AI 数字人完整产品体系,将数字人的整体自然度提升到与真人难以分辨的程度,同时实现 800 毫秒级别的端到端超低延时人机实时交互,通过完备的 SaaS 化平台工具,用户可自主管理数字资产,配置数字人工作。目前,小冰数字人已成功赋能金融保险、智能车企、地产、文旅、政务、教育、零售、大消费、互联网等十余个垂直领域。
小冰团队表示,坚信技术创新的力量,将坚持致力于推动数字人普及,让数字人赋能千行百业,发挥技术进步的巨大价值。
文章来自于微信公众号“机器之心”,作者 “机器之心”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales