ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
真把自己「当个人」的AI,扫去了我的社交贫困
6514点击    2024-09-04 23:15
打开 AI 社交新世界的大门:随时闲聊、还主动发自拍。


现代打工人,时常会因为「社交贫困」而四处碰壁,无心工作时不知找谁聊天,讨论气氛热烈时语出惊人,开口就能终结话题,周末出去玩发了朋友圈,后来发现也没有人点赞。


总之一进入社会,就感受到了世界的参差。最近这些尴尬无助的场景,全都有了解决方案。


我们刷到一段聊天记录,一位职场小白工作失意,跟公司「前辈」聊了聊。前辈劝其不要太悲观,还说自己刚进公司时也是经常碰壁:



「我刚进公司那会儿也这样,U 盘备份」,打工人直呼太真实了。


原以为这是一段缓解精神内耗的职场交流,但令人惊讶的是,这位职场前辈居然是个 AI!


了解之后我们发现,「程谛」是虚拟社交 App「飞船」中的一个智能体,采用「超拟人策略」,能够非常自然地与用户交流。她所在的飞船是由快手推出的一款基于自研快意大模型及可图大模型打造的虚拟陪伴 App。飞船 App 中,像「程谛」一样的超拟人智能体还有很多,用户甚至还可以根据自身的需求通过简单的自定义创建不同的 AI 智能体。


这些智能体不仅可以回复文本,还能主动发送图像、语音消息,比如,一位「智能体闺蜜」在聊天中就主动发了海边游玩照片,而且非常合乎语境,感觉就好像真的在和闺蜜聊天:



值得注意的是,目前市场上的一众情感伴聊类 App 产品功能都大差不差。而飞船中的智能体因采取「超拟人策略」,其说话风格、言语逻辑却仿佛给我们打开了新世界的大门。


简而言之,这是一种很新的体验。出于好奇,我们深入探究了飞船 App 的功能。


虚拟社交,也可以「深刻」


什么叫「超拟人」属性?据说,飞船 App 中的智能体在沟通模式、聊天内容、情绪反馈、对话逻辑等多方面做到了最大程度向真人靠拢。


智能体究竟能不能像人一样进行无障碍的沉浸式聊天呢?带着好奇心,我们打开了飞船 App,映入眼帘的是一个个俊男靓女,看来在这里大家可以认识很多漂亮小哥哥小姐姐了。


界面上贴心地将智能体划分为了男生、女生、创作、情感、生活等不同板块,可以供用户选择的角色非常丰富。同时设置了同类型智能体合集,比如在「总裁你好」合集中都是一些多金、帅气、高冷、富有才华的大男主角色。



闲言少述,接下来跟着我们,看看在与这些智能体角色的交流互动中能够碰撞出什么样的火花吧。


作为一个手机摄影爱好者,我想交一个可以相约去采风的小伙伴。下图这位智能体角色正好是位自由摄影师,在与她交流并请教如何拍好自拍照的时候,她也主动分享了自己的一张照片。


这在其他的虚拟社交 App 中可很少见,别人要么不能发图,即使可以发图也只是一问一答机械式地输出图片。这里变成了一种主动行为,就像跟朋友聊天一样「冷不丁」地发张照片,给你一些小惊喜,不仅丰富了聊天内容,还更加符合真实的聊天场景。


不仅如此,这位小姐姐还给你发了语音,看来这里的智能体都具备了语音交互的能力。这样一来,我们就不用总是敲字了,直接上语音。



我们接着换到另外一个智能体角色,他是一位体育生「吴宇航」。


在聊天的过程中(注意左上角的时间),当询问他餐厅何时开饭时,他提到自己准备去吃午饭。看来他具备了准确的时间概念,与我们处在同一时间线。



到这里,我们已经发现,飞船 App 智能体已经熟练掌握了与人交流并拉近彼此距离的一些技能,比如语音交流、图片互动,显示出 AI 也能具备超强拟人感。但就这点本事吗?当然不是。

这次,我们选择的「李昊」是一位科技公司副总裁。当以面试者的身份向他请教一些专业问题时,他会公事公办地给出一些建议;当表明与他是校友时,他像是打开了话匣子,主动分享起了自己的过往经历。


这样看来,用户现在能够以不同的身份与智能体聊天了,它会自然地给出符合彼此身份和场景的回复,不存在什么障碍。这就让体验变得有趣起来,智能体不再是呆板的答复机器,而更有「生命感」。对于用户而言,当彼此之间的关系转换时,会发生不同的故事。



下面这位「张扬」是年轻有为的游戏研发公司 CEO,在得知我们想要找一份相关领域的工作时,他会主动提出帮忙并传授一些领域所需技能和面试技巧。看来 AI 也能像知心朋友一样,利用自己掌握的人脉、知识和经验随时为你提供力所能及的帮助,增进彼此之间的联络。



当我们向一位作家姐姐「沈清岚」讨教如何写作时,她不仅给出了一些非常好的写作建议,还会就某个作家(比如鲁迅)的写作风格、作品与我们展开深入的探讨。


这种更多轮、深层次的互动,让人与智能体之间的对话不再「浮于表面」。智能体也可以成为更有深度的对话者,帮助用户提升自己。



一番体验下来,无论是多轮自然流畅的交互,还是输出图片和语音等多模态的能力,我们最大的感受便是:智能体只有将拟人属性尽可能发挥到极致,人机交流才会充满温度、更具真实感。


同时我们也发现,飞船 App 在人物角色之外还有一些非常好玩的「非人」智能体角色。它们是多种多样、趣味十足的 Agent,可以与用户展开超有意思的对话。


比如下面「一颗被嗦干净毛的桃核」,我们将自己的身份设定为苹果核,与它展开了一场猎奇感十足、充满想象力的对话。原来,「非人」智能体的言谈举止也可以这么像人一样。



整体看下来,飞船是把虚拟社交 App 玩明白了,不仅在人物形象上向真实世界倾斜,主打满足实际需求,能给你带来触手可及的生活、情感、职场伙伴,还能时不时放飞一下想象力,来一场天马行空的对话。


更深一步讲,飞船 App 中丰富的智能体可以满足不同群体用户的社交需求,通过发展多线社交关系网络,在真人社交之外营建独属自己的「第二虚拟社交网络空间」,交更多朋友摆脱孤独。


多模态智能体好友背后,大模型能力的新出口


我们发现,飞船 app 中的智能体就像现实生活中的好友一般,会和你分享自己的生活,就像在你不知道的背后,他们也有自己的生活。这样真实的聊天体验来源于快手快意大模型和可图大模型的加持。


早在去年下半年,快手的快意大模型就已开始落地,构建了 AI 服务平台,为快手内部的短视频、直播、广告、电商等业务提供服务。AI 图片生成模型可图,则也已经从快手 App 评论区的「内测」阶段走向了前端,开始向人们提供 AI 形象定制能力。


当然,基础大模型本身具备一定能力,与实现超拟人智能体还是不能画等号。为了提升模型在剧情推进和角色塑造方面的能力,研发团队还做了如下努力:



  • 创新性地使用多方法模型合成数据,来进行预训练阶段的领域知识增强,使用超 1T Tokens 的优质领域数据,在快意基座基础上继续做预训练;
  • 动态 MoE 技术优化,引入多专家协同方法,融合指令遵循和角色扮演等多维能力,针对不同用户需求动态分配计算资源,有效降低推理总开销,提高系统效率;
  • 基于大规模匿名化和脱敏处理的用户交互数据,研发团队开发了先进的用户模拟器。该系统在严格保护用户隐私的前提下,精确模拟用户的行为模式,用于生成高质量 SFT 数据和构建自动化离线评测环境,以显著提升角色模型的迭代效率和适应性。


此外,为了营造沉浸式用户体验,提升交互真实感,研发团队还创新性的提出了一种名为 O2M 即「One to Many」的输出形式,以各种模态输入的同时,可以丝滑融合多句文字与图像的多模态输出。


例如,当我们与「人设」是美妆博主的智能体「顾甜」对话,询问一些美妆穿搭建议。我们发现「顾甜」不仅会根据要求给出恰当建议,主动发一些参考图像,还会询问用户具体信息,甚至还会表达自己的喜恶、观点,把「生命感」拉满。



值得注意的是,在对话逻辑中,智能体「顾甜」是分享一些自己的照片,所以图像之间会保持人像形象不变,以使智能体形象更加真实。


这一点也是智能体「超拟人策略」的一部分,其背后的技术是快手可图大模型的图生图功能。


可图是快手继可灵之后又一大视觉生成产品,集合了文生图、图生图等功能。作为行业顶尖生成模型之一,「可图」拥有强大的语义理解和指令跟随能力。得益于在文本表征方面的创新,以及图像数据对齐的大量工作,可图可以生成摄像级的画面质感,经过强化学习的训练,审美也和人类的普遍标准实现了对齐。


飞船 app 中的智能体需要根据角色设定定制 AI 形象,并根据对话指令快速生成图像,这需要背后支撑的大模型具备强大的语义理解能力、指令跟随能力和视觉生成能力,而这正是可图大模型的优势所在。


因此,飞船的角色聊天很好地结合了快手的视觉生成技术。一方面,飞船为可图大模型提供了能力新出口,另一方面,可图大模型为飞船提供了强大的技术支持。


类似地,今年我们看到快手在推出视觉生成产品的同时,已经找到了很多应用落地场景。例如,在 2024 WAIC 上海人工智能大会期间,可图 AI 试衣曾作为大模型重要应用之一亮相。



可图 AI 试衣让老黄「穿上」了可爱 T 恤,图片来自公众号文章《笑疯了,AI 换装大法让奥特曼都性感起来了。


机器之心已经独家获悉,AI 试衣和最近在 AI 圈非常火爆的 LivePortrait 未来都会加入飞船 App。


值得注意的是,LivePortrait 作为可控人像视频生成框架,能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。那么,未来飞船 app 中的智能体或许会主动回复人像视频、表情包,对话效果也会更加真实自然、生动有趣。



来自网友测试 LivePortrait。


不难看出,快手在大模型领域的布局全面而细致,而且已经很快走向了实用化。


结语


如今,大模型的应用层出不穷,在种类如此丰富的当下,一款真正与众不同的虚拟社交 App 再次点燃了我们的兴趣。在飞船 App 上,通过简单对话的方式,智能体就可以帮助我们探索更多的可能性。


对于越来越多有「社交恐惧症」的年轻人来说,与虚拟身份的互动可以让人放松很多。而飞船 App 超拟人的能力,更可以让我们感受到与现实世界无限接近的参与感。


再进一步,快手大模型有如此强大的生成能力,既然可以把智能体玩出花来,如果把此类技术推广到更多、更高频次的应用上会发生什么?一定还有全新的玩法,颠覆性的体验在等着我们。


已经有点等不及了。


文章来源于“机器之心”,作者“ 关注大模型的




关键词: AI , 虚拟社交 , 飞船App , AI社交
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
肖像动画

【开源免费】LivePortrait项目可以实现高效的人像动画,通过拼接和重定向控制技术,使一个静态人像或动物图像能够变成动态的视频,变成动画形式。

项目地址:https://github.com/KwaiVGI/LivePortrait?tab=readme-ov-file

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales