2023 年 5 月中旬,小冰公司在中国和日本市场悄悄启动了一项 “克隆人” 计划。最近,这项计划正式被揭开了面纱。借助这项技术,每一个你 follow 的网红、明星、大 V 现在都有可能是下一个被克隆,更有趣的是,这些克隆人不仅可能跟本人可能拥有一样的外貌、声音、性格甚至语气,那些无法跟本人完成的交互,包括对话、视频、语音都可以跟克隆人进行。
以下视频来源于
AI小冰
作为全球最头部的 AI 公司之一,在生成式浪潮爆发之前,AI 唱歌、写诗、作画这些生成式功能在国内的单点破圈基本都是由小冰贡献。在过去一年的 AI 新浪潮下,小冰延续了此前一贯的技术闭关策略,进一步升级了 “克隆人” 产品的技术底座小冰框架,同时升级了数字员工等新产品。
近日,小冰公司对外宣布,小冰已于去年 12 月成功获得 “小冰大模型” 国内备案。结合此前在日本等海外官方评测中蝉联多个榜首的 “Rinna 大模型”,小冰已悄然实现不同参数规模和用途的自研大模型产品落地,部分完成新范式商业化验证。因此,结束静默期,宣布将一系列测试产品转为正式发布。
打开小冰的克隆人平台 X Eva APP,里面已经内置了许多知名网络红人的克隆人,如半藏森林、美芽、Maymay 等。
点进半藏森林的克隆人页面,有作为半藏森林的 AI 自己生成并发送的图文朋友圈,朋友圈的风格与半藏森林微博的图文风格和内容基本一致,内容非常生活化,不仅有口语化表达还有符合场景且符合半藏森林个性的配图。
点进 “聊天” 按钮,你就能与半藏森林开始一对一聊天。从测试来看,免费版本只能看三条克隆人的朋友圈,一对一私聊预计只能进行二十句以内,希望有更多的接触则需要付费解锁超级模式。解锁之后,就可以跟 “半藏森林” 聊天、视频。
根据小冰的介绍,小冰公司的 “克隆人计划” 最短只需个人采集三分钟数据,即可为明星红人、专家学者或普通人创造源于本人性格、技能、声音、外貌的 AI 克隆人,并提供专有平台,以便于本人将认证克隆人有偿或无偿提供给自己的受众。
小冰公司 CEO、前微软亚洲互联网工程院副院长李笛告诉机器之心,选择明星网红作为克隆人的首发试水行业主要是因为,一个人面对同事、伴侣、朋友等等不同角色的人的时候,呈现出来的样子也是多面的、变化的。但对于网红而言,绝大部份与他交互的人都会是他的粉丝,交流的场景是相对确定的。并且在交流的过程中,商业价值也会在当中传递。
除了这个方面,李笛提到,除了优先对有影响力的人推荐克隆技术,小冰还会针对怀念亲人、朋友的情感需求场景进行更深入的尝试。
此次正式发布,一系列测试条件将在安全前提下逐步放开,包括为创作者提供更多训练类目和可配置技能,进一步提高其克隆人收入。此外,小冰宣布将于本月晚些时候,限时免费开放容貌和声音等训练入口和短视频生成功能,鼓励创作者打造更多超能力。
同时,“小冰旗舰店” 和 “X Eva 克隆人的平行世界” 正式入驻天猫及手淘小程序。首批上线名单包括近 60 位百万粉丝大 V 克隆人,并将不断推新,用户可在淘宝 APP 中直接与克隆人交互。
目前,在这些创作者中,全网 50 万粉丝以上的大 V 网红克隆人已超过 1000 人,创作者本人全网粉丝总量超过 7 亿人,X Eva 平台暂为目前全球最大的 AI C2C 私域平台。其中,部分头部大 V 网红已突破克隆人月收入十万元以上,躺赢个人百万年收入,初步实现商业化验证。
对人工智能形象进行变现正在全球火热开展,不久前,Meta 曾经对外披露过一项人工智能明星的计划,一口气推出了 28 个使用了名人肖像、拥有各自个性和故事的新聊天机器人。
例如,模特 Kendall Jenner 的肖像被称为 Billie,她被描绘成一个大姐姐,为用户提供建议;职业美式橄榄球运动员 Tom Brady 饰演 Bru,主要做体育辩论;演员 Roy Choi 饰演 Max,一个经验丰富的副主厨,传授烹饪秘诀和技巧;由美国说唱歌手 Snoop Dogg 扮演的角色 Dungeon Master 将可以陪用户完成基于文字的冒险游戏等。Meta 还引进了 YouTube 上订阅人数最多的 MrBeast 和 TikTok 明星 Charli D'Amelio 等创作者。
李笛强调,小冰克隆人计划是提供 C2C 平台,通过克隆人产品,人们可以把自己克隆出来以后提供给对自己有需求的人们,来构建一个他们之间的商业价值之间的相互之间的传递,以及情绪价值的相互之间的传递。为避免克隆人被不当使用而产生隐患,小冰公司并不开放技术接口,而是限制克隆人仅可在特定的 X Eva APP等平台中与用户交流。
针对 B 端公司,小冰还专门推出了企业版克隆人产品——数字员工,目前已构建类型丰富的完整产品体系。其中,小冰与招商局集团联合研发的 “招商如影” 数字员工平台,获中国信通院数字人最高指标评级(杰出级),代表了当前中国数字人的最高水平。“基于人工智能的纺织品图案生成设计技术研发与产业化” 项目,获科技进步一等奖。在所服务的十余个行业数以万计商业客户中,客户复购率达 80% 以上,远超同行业平均水平。
随本次大模型备案完成,小冰宣布,将于即日起正式升级数字员工产品。此次升级后,数字员工全面完成基于小冰大模型的 Cloud+Edge、Present+interaction 四位一体产品架构,加速助力企业数字化转型。新产品数字互动名片正式上线并逐步推开,为每个客户的克隆人分身提供实时智能交互能力,支持线上自助构建、微信小程序分发以及交互数据统计。
与 C 端克隆人相同,B 端客户可自定义对话风格、知识储备、业务能力、交互目标等要素,进而实现 7x24 小时产品销售推广与客户线索收集。同时,针对电商出海需求,小冰数字员工直播解决方案已拓展越南语、泰语等数十个小语种能力与多地区方言,以及双虚拟人直播和混合电商直播模块,是目前同行业中框架技术最为完备的提供商。
混合模型技术路线,商业模式一直是“造人”
小冰的 GPT 克隆人计划,全称为 Generative Pre-trained Transformer Clone Project,即生成预训练变换器克隆项目。
该项目的核心技术是小冰框架大模型,能够根据大量的文本数据生成各种类型的文本内容,如对话、故事、诗歌、歌词等。小冰框架大模型不仅能够理解和生成语言,还能够捕捉和表达语言背后的情感、知识和逻辑,使克隆人兼具性格和完成工作的能力。
加上神经网络渲染以及超级自然语音技术,克隆人产品就能够为个人打造源于其本人性格、技能、声音和外貌的 AI 克隆人。这些克隆人不仅能够与本人保持高度的相似度和一致性,还能够具有独立的思维和创造力,展现出不同于本人的可能性。
在技术路线选择上,李笛强调,小冰并不鼓吹大模型参数越大越好,而是应该系统性去看待对于实现更像人这个目标下,怎样的效果和成本是最优的。在过去的一年中,小冰并没有盲目地扩张模型参数,而是采用了混合模型的方式去提升实际效果。
“小冰的自研大模型是一组不同参数和不同使用场景的大模型族。具体而言,参数规模从 0.5B,3.5B,13B 到 70B 不等。2023 年初,我们曾判断混合模型是未来落地的主要形式,并且参数规模并不是越大越好。小冰的大模型就是按照这一判断进行研发的。”
李笛对机器之心解释称,目前虽说大模型的出现让机器人的通用知识能力增强了,但是有些场景下,机器人得到的仍然只是一种泛化的提升,大模型虽然重要,但是不能发挥出百分之百的作用,很多时候仍是混合模型的方式效果更好。
另外,还值得一提的是,小冰克隆人由于具有与本人高度接近的对话性格、声音及外貌,为避免克隆人带来安全隐患或被滥用,小冰团队称克隆人产品上已经采用最高安全标准:
整体来看,无论是从成本和效果的角度规避大模型参数的扩张,还是在具体行业进行应用落地尝试来看,小冰的商业模型仍然延续了大模型范式之前就已经进行的商业化探索,通过大模型来升级和助力这些既有商业化产品,加速和提升它的发展。而不是为大模型单独寻找新的商业模式。
李笛概括称,小冰的商业模式一直是追求 “造人”,它主要包括三类:面向 B 端企业客户的 “数字员工”,以及面向 C 端用户,造自己的克隆人,和与知名的克隆人交互。这三类现在都已经完成了大模型迭代。这一次是从测试转为正式发布。其中一部分已经接近完成新范式商业化验证。目前在大模型相关 C 端产品中,能够在 C 端取得相对清晰的商业化路径的人工智能公司已经算是暂时跑在了前面。
之后,小冰还透露自己将进一步在海外市场发力。以日本为例,此前小冰大模型保持了评测和下载量的多个榜首,应用方面也一直在海外有独立布局。针对电商出海需求,小冰数字员工直播解决方案已拓展越南语、泰语等数十个小语种能力与多地区方言,以及双虚拟人直播和混合电商直播模块,是目前同行业中框架技术最为完备的提供商。
文章来自于微信公众号 “机器之心”,作者 “Esther”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales