之前热映的《流浪地球2》影片中,刘德华饰演图恒宇是个“数字生命派”,企图通过超强的算力,将自己早逝的女儿“复活”。
想象一下,现代人拥有了全新的“赛博招魂术”,大家不再信仰神婆,而是诉诸AI。
听起来好像有点吊诡,又有些“超乎伦理”。
但事实是,已经有很多人在这么做了。
这一年,AI复活亲人、宠物、名人等的新闻是一个接一个,大家讨论的热情也从未消减。我们先来看几个典型案例。
在去年的清明节期间,杭州的浙江安贤园也推出了全息沉浸式缅怀空间,运用互联、共享、数字体验等元素,通过AI技术还原逝者的音容笑貌,为前来缅怀的家属提供再次与亲人“面对面”的沉浸式追思礼。
在今年2月底,知名音乐人包晓柏借助AI技术实现了一个令人动容的场景:他的女儿,尽管已经去世,却在母亲生日当天通过数字人技术为她献唱了一首生日歌。
在3月初的商汤科技年会上,刚刚去世不久的商汤科技创始人汤晓鸥以数字人的形式再次出现在人们的视野中。并进行了一次“汤式风格”的演讲,风格,谈吐与真人几乎无异。
最近,也有胆大包天的网友,未经逝者家属同意,利用AI技术“复活”了李玟、乔任梁等已故明星,遭到了家属和一众网友的热议。
有网友更偏向于感性,更加关注AI克隆的逼真程度,与带来的情绪价值。也有很多网友更偏理性,谈论更多关于法律、伦理道德等问题。
随着大众对此的认知不断刷新,接受程度不断提高,越来越多的朋友选择一试,这不,临近清明,AI复活就成个“热门生意”。
大家说的AI复活,AI克隆,数字生命等,本质上是一个东西,应用在了不同的场景而已。
据本少女了解,市场上对这块的需求非常旺盛,未来市场上情绪消费也具有较大的想象空间。
不只是AI复活亲友,许多留守儿童会克隆父母,陪在身旁,孤寡老人会克隆外出打工的孩子,甚至异地恋也会克隆一个情侣形象,还有人克隆了逝世的宠物...
据业内创业者透露,定制化的“数字生命”单价平均5万元一个,这会是一个年收入500万到1亿的市场。
在情感支持方面,“数字生命”能为人们提供了新途径来怀念和纪念已故的亲人,而且在文化传承领域,它还能使历史人物形象生动地呈现,让用户在互动体验中深入了解传统文化和爱国主义精神。此外,在技能培训方面也展现出巨大潜力,通过提供个性化的“一对一”数字教师指导,能够以更高效的学习方式和更经济的成本满足人们的教育需求。
可以看到,AI复活/AI克隆是一个极具潜力的应用赛道,在合规、合情、合理的条件下,未来人们对“数字生命”的需求会越来越多。
AI复活亲友,主要是利用AI技术,通过收集逝者的文字描述、图片、视频和声音资料,输入AI算法模型中,从而模拟生成一个数字人形象。
得益于近一年这个大语言模型(LLM)和智能体(AI Agent)的发展,“数字生命”已经逐渐走进现实。
这个数字人形象拥有逝者的性格、记忆等特征,能够在一定程度上“复活”逝者,让生者能够与之进行交流或缅怀。
AI复活目前主流的技术实现思路如下,整理如下:
其中蓝色方框为大语言模型模块,提供数字生命的整个大脑能力,最好有被克隆的人的聊天记录,书写的文字,生平简介等等资料。
绿色方框为面部形象,现在大都是2D的,用多张图片可以训练模型。3D的成本比较高,技术也没那么成熟;
粉色方框为声音克隆,现在大概3s-30s的音频素材,就可以克隆的非常逼真。
事实上,我们离真正的数字生命,还比较遥远。
2D形象,声音,口型的技术已经相对比较成熟,但最核心的大脑思维能力,还远远不够。怎么能让AI更像人,是当下研究的一大方向。
目前市面上有非常低配版的实现方案,甚至只需要10块钱(智商税,不建议买)。这仅能算是形象的简单克隆,无法称得上“数字生命”。
不过,目前国内也有许多优秀的AI技术公司,在做专属定制化的AI数字生命,该方式需要提供逝者生前非常丰富的数据,且需要精细的模型训练与微调。如新畅元NNKOSMOS、天地在线、天娱数科等,都值得关注。
AI复活技术,给了亲人再次重逢的机会。那么,你会愿意购买吗?
以及,你愿意被“复活”吗?
本文来源于公众号特工宇宙,作者特工少女
【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。
项目地址:https://github.com/babysor/MockingBird
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales