ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
大佬点赞、大厂跟进,AI播客,正在引爆音频经济
3751点击    2024-10-12 10:32

用短视频逻辑 做播客


AI这把火终于烧到了播客。 


近期,谷歌开发的AI博客NotebookLM彻底火了。原因是,它能将用户提供的内容进行总结,并生成一段引人入胜的对话式播客,把信息娓娓道来。


国外AI大佬Andrej Karpathy更是称赞其“点亮了LLM的新交互范式”。如今,国内字节的豆包大模型也已跟进。


那么,NotebookLM究竟有哪些有趣的玩法?而当AI进入播客领域,又会对其产生怎样的影响呢?


01 解锁使用AI播客的三种姿势


从名称就可以看得出,NotebookLM的定位起初是一款AI云笔记软件。


它基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。


到这里,NotebookLM和它的名字一样普通,和别的AI笔记没区别。


要说NotebookLM破圈,全靠生成语音功能,它把小作文变成了超逼真的电台聊天。


使用者尝试了各种玩法,他们把各种书籍、文章、其他播客转成AI短音频。


这才发现,NotebookLM在信息的组织、检索和验证方面做得很好,适合需要精确引用和深入研究特定资料的场景,如学习研究、法律分析、商业报告等。


找到了差异化的使用场景,NotebookLM火也是自然的。


做成一档绘声绘色的播客节目,NotebookLM离不开三个开源模型(Llama 3.1 405B、MeloTTS、Bark),是它们帮助NotebookLM完成从理解文本到生动言说内容的过程:


①长文本理解:Llama 3.1 405B擅长处理长文本,能够理解和生成高质量的文本内容。 


②口语化人声:文本转语音 工具MeloTTS,能将输入的文字转化为自然流畅、可定制的声音。

 

③音效:文转音频模型Bark,能生成包括音乐、背景噪音和简单的音效,还有高度逼真的非语言交流,如大笑、叹息和哭泣。 


接下来介绍几个AI播客的用法,看看哪一个是你需要:


1、最强AI第二大脑,“信息快餐”开吃


用NotebookLM对论文、书籍、公知社交平台进行梳理总结,并生成逼真生动的人声娓娓道来,效果惊艳。


有人用“股神”段永平的社交主页投给AI,只花5分钟,就做了一档英文播客《段永平的故事》。


也有人对NotebookLM上传了几千条Flomo笔记,一期近20分钟的podcast,讨论了笔记里内容,还能给人以灵感启迪。


这可能是目前的“最强AI第二大脑”产品。


AI播客把原本结构化、线性表达的知识文本,降格成几分钟就能听完的“信息快餐”,就像是用了《三体》中的降维武器“二向箔”。


▲NotebookLM分析《老美都要在太空建数据中心了!成本大降95%,英伟达强力支持》(乌鸦智能说文章) 


因为效果过于自然逼真,Andrej Karpathy也给出盛赞,称其“点亮了LLM的新交互范式”。


2、自我关怀,听老外轮番“彩虹屁”


“如果你感到有点沮丧,把你的社交动态粘贴到NotebookLM中,就能得到一通8分钟的‘真人’深度赞美。”


这是HuggingFace首席科学官分享了用NotebookLM进行自我关怀的方法。(之前我们也写过一个在自我关怀方向的AI产品,SocialAI)


把个人社交媒体上的动态/简历导出来,然后复制粘贴给NotebookLM,AI博客里的“人”会对使用者进行狂热的讨论,还甚至讨论起对方的优劣势,以及会不会录用对方的问题。



其实我们每个人最感兴趣的,是自己,所以延续自己的想法和兴趣的内容,充满乐趣和正反馈。


在这个创业机会上,国内已经有大厂出手了。豆包产品经理钟二信在即刻上透露,豆包很快也会上类似的功能。


3、自制英语播客,费曼学习法达成


当老外用AI总结播报论文、制作夸夸的时候,国内却开辟了AI播客的另一个场景——学英语。NotebookLM带动了AI双人英文播客的火爆,小红书上不少博主都在倾情推荐。



有人探索出了一套超棒的英语听力练习法,简直是费曼学习法+自制podcast,制作步骤也非常地简单:


①学习:听AI播客讨论 (音频约7~18min) ,进入情景学习 


②反馈:导入笔记,听AI播客来复盘,内容熟悉,不会走神 


③调整:自己控制话题难度,再也不怕听不懂 


这种学习方法可以让人沉浸地表达和思维。AI播客里一男一女,美式英语纯正清晰轻松幽默,而不是枯燥的英文新闻单向输出。


场景诞生的原因是国人学英语的高需求。我国的英语市场常年火爆,根据数据显示,少儿英语培训市场在2018年就达到3160亿元,成人英语市场规模在2019年也达到了953亿元。


得益于此,中国是访问NotebookLM最多的国家,甚至超过了美国。


02 声音短视频化,知识内容生产及消费方式将被改变


一直以来,播客都是一个相对小众的需求。


这和其内容特点有很大关系。与短视频等内容不同,播客内容更侧重于知识输出,内容追求知识密度,因此播客的时长往往较长。


比如,国外头部播客的时长动辄三四个小时,而国内播客小宇宙上,大多数电台的节目时长也在一小时左右。


但这就带来了两个问题:


一方面,长时长内容,大幅提升了用户的消费门槛。


根据PodcastIndex的数据,当前还在活跃的播客有400万以上。而平均一个人收听播客的时长为6-7小时,这注定有海量的播客内容无法被广泛消费。


另一方面,这也不符合大众内容消费碎片化的趋势。


在TikTok上,电影解说账号的点赞量平均在3万左右,爆款可达到百万点赞。


解说型书单视频也大受欢迎,这种号的主要内容是“3分钟内解说一本书”。抖音上像是@不略 这样的号,在只发布30+个作品时,就已经拥有180w万点赞了。



以上两点,使得播客的受众相对受限。


但NotebookLM的出现极有可能改变这一切。


有公式就是快!NotebookLM加快了内容的自动化生产,它将高密度文字内容转化为听觉材料。它还把优质内容变短了,“二创”的知识短音频更符合当下的消费习惯。


同时,AI特有的交互特点,也能实现AI播客的定制化,让知识更入耳入脑。


比如,将特定的阅读材料,用AI处理成更符合自己接收习惯的东西,可以是自己喜欢的声音,又或者双人畅言聊天。


当播客内容的供给被AI进一步放大,且形态更符合用户消费习惯,播客消费仍然很大的挖掘潜力,比如开车、通勤、入睡时,也就是长时间、无注意力(无法用手操作)的场景。


▲来源:即刻@Yangjixxxx


可以想象,随着AI技术的进步,将出现一个更加丰富和智能内容生态。而这或许是内容消费侧潜力最大的机会。


文章来自于微信公众号“乌鸦智能说”,作者“朗朗”



关键词: AI , AI播客 , NotebookLM , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales