经常读咱们文章的小伙伴们,你们是否觉得文字的方式有些枯燥了呢?没关系,这里我制作了本文的一期播客,欢迎收听!
还有爱好写作或者喜欢听播客的朋友们,你们是否想过做一档属于自己的播客,但又无从下手呢?没关系,今天分享的这个工具先给你打个样 ~
最近,语音人工智能初创公司 ElevenLabs,在他们的 ElevenReader 应用中推出了一个叫做 GenFM 的功能,这个功能能通过我们上传的内容,快速制作一期由两名 AI 对话交流的播客。通过给对话加停顿、「嗯」声和呼吸等人类元素,整场对话非常自然。再结合该公司积累的丰富多样的 AI 音色,GenFM 功能可以和之前 Google 出品的 NotebookLM 一争高下了。
因为平台支持各种类型的内容来创建播客,如文章链接、文本、PDF 文档、电子书,甚至还支持上传 YouTube 视频、一键扫描文档,并且生成时间快,所以它的适用场景非常广,只要你想到什么有价值的东西,你都可以用它转换成播客形式,听两位 AI 唠唠你的好东西。
比如:
这里我试了下用我很喜欢的播客节目制作一期播客,有点套娃的意思了,下面有请两位 AI 主播,聊聊「知行小酒馆」最近一期关于教育的播客《高考前只管努力,工作后只想发疯,我们的教育究竟怎么了?》:
听听里面的语气词,虽然他俩的中文不是特别好,但还真挺像外国人说中国话的。
两位 AI 主播聊得也很深入,确实是理解了原播客的观点。有几个亮点值得一提:
更令我惊讶的是,他们在对话里,还很适当地加了各种语气词,这让听众可以感受到他们的情绪,一会儿激动,一会儿有所顾虑,没错,我感受到 AI 人的情绪了!另外,他们还会在思考的时候停顿,也给了听众们一点遐想的空间,代入感满满。
虽然讲稿还是文字的形式,但两人一问一答的对话方式让文字变得生动起来,读者也更容易进入这个话题,去思考他们的问题。
听了这个还不过瘾,要不我再试试用夕小瑶的技术文章生成播客?如果质量不错,那以后不就可以用它来生成播客,辅助学习知识了嘛 ~
就用这篇干货满满的综述类文章吧:从 CoT 到 Agent,最全综述来了!上交出品
怎么样?(忽略稍微有些出戏的口音和 15 秒位置的奇怪气泡音)虽然时长不长,但也算是通俗易懂地以一问一答的方式,把 CoT 和 Agent 的概念、原理、应用场景、挑战以及未来趋势等等说得非常清楚了。听了他们的对话,是不是对这些高大上的技术更加感兴趣了呢 ~
既然 GemFM 可以让知识变得更简单、有趣,还支持 PDF 文件,此时我又有一个大胆的想法,让我们再来试试这本当年入门 AI 时啃了很久的西瓜书吧 ~
不是,这个播客更像是两位 AI 主播在帮周老师直播带货,就怕他们最后来一句“123,上链接”了,不过他们的带货是很很公正的,因为他们不仅聊了本书的结构、内容,还提到了这本书的不足,就是机器学习发展得太快,有些最新的技术没有覆盖到。不过没关系,关注夕小瑶就够了。
等等,你以为 GenFM 就这些本事了?No,远远不止,因为它还可以通过视频生成播客。紧跟时事(本来想发给它麦琳的十大名场面,可惜基于视频的生成目前还只支持英文字幕),我给在 YouTube 上找了 OpenAI 第 3 天的直播录像发给了它,让 AI 主播们来聊聊最新发布的 Sora(听说实测一言难尽,感兴趣的可跳转:别吹 Sora 了,实测一言难尽。甚至分不清人脸和猪??)。
有一说一,GenFM 的英语口语还是地道的哩。
不过没想到吧!GenFM 不仅能将文字升维成更轻松的音频,还可以把视频降维成更简单的音频,以后看视频吃个瓜,还能有两个伴和你一起唠嗑,别提有多热闹了 ~
GenFM 的应用场景还有很多,我估摸着聪明的小伙伴们心里早已有了想法,欢迎留言分享你们的播客作品!
AI 火了后,文字总结成为最先被广泛应用的场景之一。它通过提炼文字内容的核心信息,帮助用户快速理解复杂内容,解决了信息量过载和时间碎片化的问题。然而,这种方式虽然高效,却在形式上局限于“吸收信息”的单向互动,缺乏趣味性和代入感。
而我们今天分享的 GenFM 功能,就打开了另外一条思路:通过对话为主的播客形式,将内容的价值延伸到更丰富的场景体验中,让内容更有温度。
不仅如此,在我看来,对话这种形式,更能复现出内容的产生背景。试想我们写的文章、论文,难道不都是在一次次自己与自己、与同学、与老师的交流中产生的吗?如果能用对话的形式,将复杂的内容通过角色间的讨论重新呈现,听众是不是会获得更深刻的理解呢?
从文字到音频,技术的发展总能在意想不到的地方开花,为我们又带来了新奇的体验。GenFM 这类创新展示了 AI 在内容交互领域的无限潜力,在未来,AI 技术可能会进一步提升对话的智能化程度,比如实时生成个性化的播客内容,作为嘉宾直接参与到 AI 的播客互动中,等等。
让我们继续保持对 AI 技术的观察吧,咱们下期再见 ~
文章来自微信公众号“夕小瑶科技说”,作者“土Bo鼠”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales