ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
一单50元,“AI复生”以爱为名还是伪善?
2600点击    2024-04-04 09:44

最近,不少已故明星通过AI技术被“复活”了。“嘿,你们好吗?我是CoCo李玟。”此前,一段由AI生成的数字人“李玟”坐在镜头前回应粉丝的视频受到关注,据悉,这段视频是一位网友利用AI技术,将李玟生前的图像和语音数据结合而成。


有肢体动作,说一段话,已故亲人熟悉的音容笑貌展现在面前,这是一种精神慰藉还是往伤口上撒盐?多位已故明星家属并不支持粉丝们这样的做法,不希望已故亲人的肖像被任意使用。不久前,已故演员乔任梁的父亲喊话“撕下‘AI复活’明星的伪善面具”话题登上热搜。


当生成式AI兴起,“AI复活亲人”已成产业链。但这一次,AI又一次站在了人类伦理与道德的边界。


更像一台机械的复读机  


“我要给丫丫完整的一生。”在电影《流浪地球2》中,图恒宇的这句话,或许是人们对数字生命无尽的想象。在如今AIGC浪潮下,这种想象已经照进现实,甚至普通人也触手可及。


在一些电商平台上,《IT时报》记者发现不少提供此类服务的商家,“AI复活亲人”“老照片动起来”“声音克隆,开口说话”等是这些店铺的广告语,价格从几十元到几百元不等,不少店铺都展现了制作完成的视频效果。


在一家店铺展示的30秒左右视频中,一位白发老人面带微笑,头缓缓转动,“孩子,你最近过得怎么样,有没有好好吃饭,晚上睡得好吗?”她用慈祥的眼神注视着前方,仿佛在对自己的孩子说话。但从呈现效果来看,并没有达到惟妙惟肖的效果,能看出制作痕迹。


需要哪些素材才能制作出这样的视频?《IT时报》从一些店铺客服人员处了解到,只需要一张照片,一段本人说话的音频以及一段文字即可。“如果只让照片动起来,价格是50元,需要配上声音,价格为150元,说话字数不超过100字,制作时间3天之内。”一家店铺的客服人员说,如果没有照片上人物的音频,也可以利用AI配音,接近真人发声的效果。该店铺页面显示,有100余人购买了这项服务。


据了解,目前这些“赛博复活者”说的话是固定的,只能说买家提供的语言文本,达不到“对话”的效果。就像一段录像,无法根据场景的变化或外界的互动做出及时的反应和调整,虽然能够呈现出一定的动态和声音效果,但缺乏真实对话的灵活性和互动性。


《IT时报》记者就“购买可以实时互动的”AI商品为由,咨询了几家店铺,都表示做不了。


“仅仅通过复刻语音视频资料来重现一个形象,往往只能得到外在的形似,而无法触及内在的精髓。虽然有着相似的声音和外貌,但缺乏真实的情感和思考,更像是一台机械的复读机,无法与人产生真正的互动和共鸣,也让这个行业参差不齐。”一位AI复活的从业者告诉《IT时报》记者。


“大脑复刻”能否形成独立生命?


2023年3月23日,在上海音乐厅的舞台上,中国国家名誉主席宋庆龄先生用沪语讲述了她生前发表的最后一篇文章《愿小树苗健康成长》,这也是宋庆龄数字人首次出现在大众视野中。宋庆龄数字人制作团队开天工作室相关负责人告诉《IT时报》记者,由于可供参考的照片、音频资料非常有限,制作团队探访多地,从近千张影像照片中选取出了最经典、最清晰、形象特征最鲜明的一组照片做参考,并基于SFM(Structural From Motion)算法,还原出3D模型。 


“人的面部肌肉很多,运动也极其复杂,很多‘自然的表情’放在数字人脸上,就会失真。当前市面上通过面部捕捉形成的数字人视频,表情精细度和写实度,仍然需要结合领先的实时渲染技术,才能达到最好的状态。”开天工作室相关人士说。


在数字人赛道上,也有不少企业提供此类服务。


得益于深度学习、自然语言处理和计算机视觉等技术的快速发展,“AI复活”逐渐成为现实。


2023年,硅基智能发布了炎帝大模型,结合数据和影像资料,重建已故亲人的声音、形象乃至行为习惯,用户可以通过DUIX智能交互平台与数字人进行互动。


“我们是在为用户做数字人业务的时候想到的,数字生命特别适合AI这个赛道,一个是出内容,一个是表现内容。去年,有不少企业进行小范围的尝试。”在神马工场创始人马建军看来,如果说2023年是数字人元年,现在数字人的下半场开始了。去年,神马工场推出了成本千元以内的数字人。


在《流浪地球2》中,图恒宇通过将女儿的记忆、情感、性格、思维方式等资料上传至超级计算机,形成有自主独立意识体的数字生命形态。


马建军告诉《IT时报》记者,通过声音和视频符合一个人的形象,在技术上已经非常成熟,相似度能达到95%以上,但这只是单纯地克隆形象和声音,一两百元就可以做到,也只需要几个小时。


“目前,业界的难点在于大脑意识的复刻,这是全球都在基于大模型中一个垂直场景的探索,形象、声音加上意识才能实现真正意义的数字永生。”马建军说,关键在于知识库开放和大模型学习的问题,必须要有大量的文本,“名人可能有较多开放的知识库,但普通老百姓是没有的,受到素材所限,这也是现在整个市场没爆发的原因之一。”


深度科技研究院院长张孝荣也向《IT时报》记者表示,目前,虽然AI能在一定程度上理解和回应人类的话语,但理解能力和逻辑推理能力仍然有限。


未经授权涉嫌违法


AI应用之年,市场正在以各种方式探索AI赋能产业的途径,但服务质量不稳定、价格透明度低、个人信息泄露、AI复生内容问题的侵权等,都是“AI复生”这门生意需要面对的问题。


“‘AI复生’涉及被复生者的肖像权、名誉权等法律问题,应尊重逝者近亲家属的意愿和权益,未经授权不得擅自使用其形象和声音。‘AI复生’的应用边界在于尊重隐私、遵守法律、保障人权。”张孝荣说。


《互联网信息服务深度合成管理规定》要求,“深度合成服务提供者和技术支持者提供人脸、人声等生物识别信息编辑功能的,应当提示深度合成服务使用者依法告知被编辑的个人,并取得其单独同意”。


由于“AI复活”的伦理门槛较高,一些企业也设置了规则。比如小冰公司推出了AI技术复生伦理原则,包括当本人在世时,AI复生项目应当仅由本人自由意志决定,而非任何其他相关第三方;本人不在世的,应当沿袭法律所判定的继承人顺序,应当遵循训练数据最小化原则,避免数据滥用等。



那么,提供“AI复活”服务的店铺如何确保买家已获得授权呢?“我们只做已故亲人的视频。”一位客服表示,但是买家如何证明照片是自己的已故亲人,是否需要提供相关证明,该客服表示,并无要求。


京师律师事务所徐延轩向《IT时报》记者解释说,法律没有强制规定提供权属证明,另外商家不是使用者,也无须举证使用合法。但为了避免不必要的纠纷,商家建立合理的确权流程,要求买家提供必要的权属证明,同时提供不侵犯他人肖像权、名誉权、不商业使用的承诺,确保商家不会在不知情的情况下参与侵犯他人权益的行为。


“企业主要从肖像权或者授权等等方面去做好约束和规避风险,比如用户提供肖像,必须证明是自己或者家人的,否则平台也产生连带责任。此外,企业也需要和平台上的公模签署肖像权授权协议等,用户要签不得滥用公模的协议等。”马建华说。



本文来自微信公众号:IT时报 (ID:vittimes),作者:潘少颖



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
声音克隆

【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。

项目地址:https://github.com/babysor/MockingBird

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales