用短视频逻辑 做播客
AI这把火终于烧到了播客。
近期,谷歌开发的AI博客NotebookLM彻底火了。原因是,它能将用户提供的内容进行总结,并生成一段引人入胜的对话式播客,把信息娓娓道来。
国外AI大佬Andrej Karpathy更是称赞其“点亮了LLM的新交互范式”。如今,国内字节的豆包大模型也已跟进。
那么,NotebookLM究竟有哪些有趣的玩法?而当AI进入播客领域,又会对其产生怎样的影响呢?
从名称就可以看得出,NotebookLM的定位起初是一款AI云笔记软件。
它基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。
到这里,NotebookLM和它的名字一样普通,和别的AI笔记没区别。
要说NotebookLM破圈,全靠生成语音功能,它把小作文变成了超逼真的电台聊天。
使用者尝试了各种玩法,他们把各种书籍、文章、其他播客转成AI短音频。
这才发现,NotebookLM在信息的组织、检索和验证方面做得很好,适合需要精确引用和深入研究特定资料的场景,如学习研究、法律分析、商业报告等。
找到了差异化的使用场景,NotebookLM火也是自然的。
做成一档绘声绘色的播客节目,NotebookLM离不开三个开源模型(Llama 3.1 405B、MeloTTS、Bark),是它们帮助NotebookLM完成从理解文本到生动言说内容的过程:
①长文本理解:Llama 3.1 405B擅长处理长文本,能够理解和生成高质量的文本内容。
②口语化人声:文本转语音 工具MeloTTS,能将输入的文字转化为自然流畅、可定制的声音。
③音效:文转音频模型Bark,能生成包括音乐、背景噪音和简单的音效,还有高度逼真的非语言交流,如大笑、叹息和哭泣。
接下来介绍几个AI播客的用法,看看哪一个是你需要:
1、最强AI第二大脑,“信息快餐”开吃
用NotebookLM对论文、书籍、公知社交平台进行梳理总结,并生成逼真生动的人声娓娓道来,效果惊艳。
有人用“股神”段永平的社交主页投给AI,只花5分钟,就做了一档英文播客《段永平的故事》。
也有人对NotebookLM上传了几千条Flomo笔记,一期近20分钟的podcast,讨论了笔记里内容,还能给人以灵感启迪。
这可能是目前的“最强AI第二大脑”产品。
AI播客把原本结构化、线性表达的知识文本,降格成几分钟就能听完的“信息快餐”,就像是用了《三体》中的降维武器“二向箔”。
▲NotebookLM分析《老美都要在太空建数据中心了!成本大降95%,英伟达强力支持》(乌鸦智能说文章)
因为效果过于自然逼真,Andrej Karpathy也给出盛赞,称其“点亮了LLM的新交互范式”。
2、自我关怀,听老外轮番“彩虹屁”
“如果你感到有点沮丧,把你的社交动态粘贴到NotebookLM中,就能得到一通8分钟的‘真人’深度赞美。”
这是HuggingFace首席科学官分享了用NotebookLM进行自我关怀的方法。(之前我们也写过一个在自我关怀方向的AI产品,SocialAI)
把个人社交媒体上的动态/简历导出来,然后复制粘贴给NotebookLM,AI博客里的“人”会对使用者进行狂热的讨论,还甚至讨论起对方的优劣势,以及会不会录用对方的问题。
其实我们每个人最感兴趣的,是自己,所以延续自己的想法和兴趣的内容,充满乐趣和正反馈。
在这个创业机会上,国内已经有大厂出手了。豆包产品经理钟二信在即刻上透露,豆包很快也会上类似的功能。
3、自制英语播客,费曼学习法达成
当老外用AI总结播报论文、制作夸夸的时候,国内却开辟了AI播客的另一个场景——学英语。NotebookLM带动了AI双人英文播客的火爆,小红书上不少博主都在倾情推荐。
有人探索出了一套超棒的英语听力练习法,简直是费曼学习法+自制podcast,制作步骤也非常地简单:
①学习:听AI播客讨论 (音频约7~18min) ,进入情景学习
②反馈:导入笔记,听AI播客来复盘,内容熟悉,不会走神
③调整:自己控制话题难度,再也不怕听不懂
这种学习方法可以让人沉浸地表达和思维。AI播客里一男一女,美式英语纯正清晰轻松幽默,而不是枯燥的英文新闻单向输出。
场景诞生的原因是国人学英语的高需求。我国的英语市场常年火爆,根据数据显示,少儿英语培训市场在2018年就达到3160亿元,成人英语市场规模在2019年也达到了953亿元。
得益于此,中国是访问NotebookLM最多的国家,甚至超过了美国。
一直以来,播客都是一个相对小众的需求。
这和其内容特点有很大关系。与短视频等内容不同,播客内容更侧重于知识输出,内容追求知识密度,因此播客的时长往往较长。
比如,国外头部播客的时长动辄三四个小时,而国内播客小宇宙上,大多数电台的节目时长也在一小时左右。
但这就带来了两个问题:
一方面,长时长内容,大幅提升了用户的消费门槛。
根据PodcastIndex的数据,当前还在活跃的播客有400万以上。而平均一个人收听播客的时长为6-7小时,这注定有海量的播客内容无法被广泛消费。
另一方面,这也不符合大众内容消费碎片化的趋势。
在TikTok上,电影解说账号的点赞量平均在3万左右,爆款可达到百万点赞。
解说型书单视频也大受欢迎,这种号的主要内容是“3分钟内解说一本书”。抖音上像是@不略 这样的号,在只发布30+个作品时,就已经拥有180w万点赞了。
以上两点,使得播客的受众相对受限。
但NotebookLM的出现极有可能改变这一切。
有公式就是快!NotebookLM加快了内容的自动化生产,它将高密度文字内容转化为听觉材料。它还把优质内容变短了,“二创”的知识短音频更符合当下的消费习惯。
同时,AI特有的交互特点,也能实现AI播客的定制化,让知识更入耳入脑。
比如,将特定的阅读材料,用AI处理成更符合自己接收习惯的东西,可以是自己喜欢的声音,又或者双人畅言聊天。
当播客内容的供给被AI进一步放大,且形态更符合用户消费习惯,播客消费仍然很大的挖掘潜力,比如开车、通勤、入睡时,也就是长时间、无注意力(无法用手操作)的场景。
▲来源:即刻@Yangjixxxx
可以想象,随着AI技术的进步,将出现一个更加丰富和智能内容生态。而这或许是内容消费侧潜力最大的机会。
文章来自于微信公众号“乌鸦智能说”,作者“朗朗”
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales