扣子空间上线极致拟人的AI播客,这次真是降维打击了。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
扣子空间上线极致拟人的AI播客,这次真是降维打击了。
8773点击    2025-05-29 10:12

一篇文章,一键转成几乎跟真人无异的十几分钟中文AI播客。


有打断、有语气、有停顿,就特么离谱。


这,就是我用我现在的这篇文章,生成的AI播客。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


这个语气,这个聊天的感觉,我人麻了。


这个AI播客,来自于扣子空间。


昨天,很多人在群里说,扣子空间的AI播客更新了,变得超级拟人。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


我就去直接试了一下。


当我实际听到扣子空间生成的AI播客音频的时候,我的第一反应是震撼,第二反应是恐惧,然后才是兴奋。


震撼,是因为它生成的声音之真实、之流畅,让我几乎怀疑自己的耳朵。


恐惧,是因为这种效果似乎已经越过了某个阈值,打破了人机声音之间那道隐形的次元壁,我真的无法想象,我在听的东西,是AI生成的聊天。


兴奋,是因为我知道,终于,这个世界上的无数内容创作者们,可以彻底摆脱过去声音内容生产的桎梏了,尽情享受一种前所未有的自由。


这个AI播客,打开扣子空间(就是扣子做的那个Agent平台)就能直接使用。


扣子空间网址在此:https://space.coze.cn/


这里我插一句,扣子空间之前要邀请码,现在已经全量开放了,每个人都可以直接使用。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


想要做一个类似的AI播客,非常简单。


你什么都不用管,把你想要转成播客的文件素材,上传或者发送过去,然后说一句Prompt:


“根据____,生成____分钟的双人播客,然后输出一个音频文件。”


就完成了。


不需要添加MCP,不需要引用任何插件,直接说一句话。


比如我前天写了一篇豆包视频通话的文章,大家反馈非常好,点赞啥的也很高。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


就是有朋友跟我说,文章明明写的很感动,但是她在早上开车的时候听,听AI念稿,还是很出戏的。。


我们就可以直接把那篇文章的地址从公众号里复制下来,然后跟着Prompt一起发送给扣子空间。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


很快啊,它就会用一个网页读取的MCP,直接把我的所有文字扒下来。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


然后,大概几分钟,一个播客,就给我生成完了。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


你可以直接点击链接进行下载,大家可以听一听这个效果。


扣子空间AI播客 - 卡兹克 - 豆包视频,数字生命卡兹克,3分钟


而且最抽象的是,它不仅给我生成了播客,还预判了我的预判,给我写了一个网页。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


https://space.coze.cn/s/94Zt6a9WO9Y/


把播客,变成了可视化的播客,在这个网页上,不仅可以听音频,还能看到所有的字幕。


虽然NotebookLM前不久也支持了中文,但是坦诚的说,就是那个中文我是真的听不下去,听的我直皱眉头,太朗诵腔了。


不过扣子空间也有一个小问题,就是时长问题,我在Prompt里面明明说的是10分钟,但是我跑了起码5次,都是5分钟以内,直觉上是扣子的人因为算力,所以做了一些限制,要不然10分钟理论上应该没啥问题的。


不知道大家怎么看AI播客这个事。


也不知道大家听不听播客,真的想做个调研,听过播客的举个手(可惜我看不到哈哈哈)。


说实话,我自己还是爱听的,因为确实有很多真知灼见,而且,是我为数不多的,能在内容形式上,感受到互动感和陪伴感的。


有时候楼下溜达,或者在车上通勤的时候,我就会习惯性的打开播客,来听一集。


过去,我们谈内容,大多都是文字或视频,这两种形式统治互联网这么多年,但它们各自有明显的缺陷。


文字虽然有深度、有效率,我也是靠文字为生,但坦诚的讲,文字这个东西天然缺乏情绪,读者的共鸣度除了笔力之外,其实大多数时候,完全取决于读者本人的代入感和想象力。


而视频虽然声画并茂,但创作成本极高,比如我的一期短视频,动效比较重,2分钟的视频我的剪辑几乎都要剪6个多小时,而且对于消费者来说,它几乎要消耗全部的注意力。


但播客不同,它只占用你最闲散、最被浪费的注意力,而不占用你必须投入的视觉通道,你甚至可以闭上眼睛,只需要倾听。


它本该是最平衡、最温暖、最有人情味的媒介,却一直处于一个尴尬的位置。


人类主播的音频质量高但生产成本高昂,周期冗长,而传统TTS虽快速便宜,但是缺少互动感,特别是一些干货内容,TTS读出来的东西,我自己真的很难听下去。


就像微信自带的这个听全文,我就想问你,当你在开车的时候来听我的文章,你是更想听一个冰冷冷的TTS呢,还是听一个类似于播客的形式,两人有来有回以聊天和讨论的方式,将其表达出来呢?


答案不言自喻。


而AI播客,填补上了人类创作者数量不足的空白。


AI播客不仅仅会成为内容的载体,我觉得也像可视化网页一样,可能演化成一种新的媒介。


比如未来人们可能更愿意在开车、洗澡、做饭时听新闻,听小说,甚至听公众号文章,而非用眼睛去盯着屏幕。


AI播客的普及,会逐渐模糊听觉和视觉内容的边界。


内容不再是内容本身,而是一种,流动的状态。


文字转AI播客、PDF转AI播客、音频转AI播客、视频转AI播客等等,实在太有意思了


比如我们不想在上班的时候公然摸鱼吃瓜,那其实,就可以把一个吃瓜PDF,直接转成AI播客,两人聊,可比看文字,更有意思。


这个PDF是我文章里的老演员了,AI生成的,但是很对瓜味。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


只需几分钟。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


一个比吃瓜文档更沉浸式吃瓜的AI播客,就完成了。


https://space.coze.cn/s/r2CZypIP6RQ/


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


推荐听,超好听,我自己听的,津津有味的。。。


甚至不仅是文件,你还可以,扔一段B站视频上去,让它给你生成AI播客+网页。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


https://space.coze.cn/s/5gMvrjjqjHI/


而且不止是扔一个文件上去,你其实提出一个问题,你让他搜索完以后跟你说,其实也没问题。


比如最近闹得沸沸扬扬的特厨隋卞和MCN的事,大家肯定都知道了,然后有一个梗特别的火,叫i人团队。


如果你没听过这个梗,不知道的话,其实完全可以跟扣子空间说一句:


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


无需文件,无需素材,直接一句话,他就会去搜索,搜索完然后给你生成,AI播客,让你最快速最生动最沉浸式的看懂,i人团队这是什么梗。


https://space.coze.cn/s/arJLN3JEbbA/


扣子空间上线极致拟人的AI播客,这次真是降维打击了。


最后我想聊聊替代。


诚然,很多人也在讨论,AI播客会不会对真人播客产生冲击。


我觉得,这个问题是对所有内容创作者都是一样的。


我依然认为,人类播客的独特吸引力仍不可替代。


真人主播通过长时间陪伴,与听众建立的是一种拟社交关系,听众喜欢的是主播鲜明的个性、真实的情感交流,这种由人性火花构筑的纽带并非AI一串流畅的话语能复制。


AI播客可以提供知识和娱乐,但很难让听众对背后的AI人格产生认同和喜爱,因为大家都知道那不是真实的人。


所以我觉得,其实扣子空间的这个AI播客,是把整个播客的盘子给扩大了,让更多人,理解、尝试播客的乐趣。


而不是替代。


多个模态之间的相互流转,一定会是未来最主要的旋律。


无需抵制,大胆去用就行了。


不过,我也还是觉得。


AI播客很酷,很有趣,但是再有趣的场景,也不能替代真实的人际交流。


毕竟,没有什么比和朋友面对面地聊天,一起分享观点和笑声更让人愉快的了。


所以,最后。


你要不要一起找个时间,跟你的朋友,坐下来好好聊聊天啊?


说一句:


“我请客,咱们边吃火锅边聊聊天,怎么样?”


文章来自于“数字生命卡兹克”,作者“卡兹克”。


扣子空间上线极致拟人的AI播客,这次真是降维打击了。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales