发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...
7065点击    2024-12-16 15:02

经常读咱们文章的小伙伴们,你们是否觉得文字的方式有些枯燥了呢?没关系,这里我制作了本文的一期播客,欢迎收听!


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


还有爱好写作或者喜欢听播客的朋友们,你们是否想过做一档属于自己的播客,但又无从下手呢?没关系,今天分享的这个工具先给你打个样 ~


最近,语音人工智能初创公司 ElevenLabs,在他们的 ElevenReader 应用中推出了一个叫做 GenFM 的功能,这个功能能通过我们上传的内容,快速制作一期由两名 AI 对话交流的播客。通过给对话加停顿、「嗯」声和呼吸等人类元素,整场对话非常自然。再结合该公司积累的丰富多样的 AI 音色,GenFM 功能可以和之前 Google 出品的 NotebookLM 一争高下了。


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


适用场景


因为平台支持各种类型的内容来创建播客,如文章链接、文本、PDF 文档、电子书,甚至还支持上传 YouTube 视频、一键扫描文档,并且生成时间快,所以它的适用场景非常广,只要你想到什么有价值的东西,你都可以用它转换成播客形式,听两位 AI 唠唠你的好东西。


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


比如:


  • 让文字更方便、有趣:不方便看文字的时候,比如上班开车路上、运动等,听 AI 朗读又很容易走神,就可以试试把喜欢的文字转换成播客,先听听 AI 的思考。
  • 让知识更简单、轻松:碰见难啃的知识点,自己一个人学很枯燥,缺少伴儿,又或者想分享一些专业知识,用文字的方式担心别人理解困难,也可以试试将它们转化为播客,先磨磨耳朵。
  • 让播客制作更易上手:自己写好了文字,让两位 AI 打个样,聊聊文字里的内容,这样自己对播客的形式会有更多想象的空间,另外也可以让 AI 给自己的内容把把关,就把它俩当成内容点评官看待。


这里我试了下用我很喜欢的播客节目制作一期播客,有点套娃的意思了,下面有请两位 AI 主播,聊聊「知行小酒馆」最近一期关于教育的播客《高考前只管努力,工作后只想发疯,我们的教育究竟怎么了?》:


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


听听里面的语气词,虽然他俩的中文不是特别好,但还真挺像外国人说中国话的。


两位 AI 主播聊得也很深入,确实是理解了原播客的观点。有几个亮点值得一提:


生成的播客结构非常清晰


  1. 背景引入:首先引入这个教育机构的成功案例,抛出话题。
  2. 介绍主体:然后介绍他们的教育理念,帮孩子找我自我,成为一个独立、完整的人;描述他们的教学内容,比如一些特别的课程,“生死课”、“做事课”等等。
  3. 分析意义:再去理解他们教育行为背后的目的,他们相信当一个人找到自己的兴趣和方向时,学习效率会大大提高。
  4. 从另一个角度思考:紧接着又表达出对这种创新的担忧,毕竟新事物往往具有两面性,他们的探索不一定适合每一个孩子,但他们提供了一种新的思路。
  5. 从中得到的启发:分享了一些适合普通家庭的教育建议。
  6. 展望未来:对未来的教育充满期待,个性化和多元化将是趋势。


含有丰富的哇、嗯等语气词


更令我惊讶的是,他们在对话里,还很适当地加了各种语气词,这让听众可以感受到他们的情绪,一会儿激动,一会儿有所顾虑,没错,我感受到 AI 人的情绪了!另外,他们还会在思考的时候停顿,也给了听众们一点遐想的空间,代入感满满。


提供了完整的逐字稿


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


虽然讲稿还是文字的形式,但两人一问一答的对话方式让文字变得生动起来,读者也更容易进入这个话题,去思考他们的问题。


听了这个还不过瘾,要不我再试试用夕小瑶的技术文章生成播客?如果质量不错,那以后不就可以用它来生成播客,辅助学习知识了嘛 ~


就用这篇干货满满的综述类文章吧:从 CoT 到 Agent,最全综述来了!上交出品


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


怎么样?(忽略稍微有些出戏的口音和 15 秒位置的奇怪气泡音)虽然时长不长,但也算是通俗易懂地以一问一答的方式,把 CoT 和 Agent 的概念、原理、应用场景、挑战以及未来趋势等等说得非常清楚了。听了他们的对话,是不是对这些高大上的技术更加感兴趣了呢 ~


既然 GemFM 可以让知识变得更简单、有趣,还支持 PDF 文件,此时我又有一个大胆的想法,让我们再来试试这本当年入门 AI 时啃了很久的西瓜书吧 ~


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


不是,这个播客更像是两位 AI 主播在帮周老师直播带货,就怕他们最后来一句“123,上链接”了,不过他们的带货是很很公正的,因为他们不仅聊了本书的结构、内容,还提到了这本书的不足,就是机器学习发展得太快,有些最新的技术没有覆盖到。不过没关系,关注夕小瑶就够了。


等等,你以为 GenFM 就这些本事了?No,远远不止,因为它还可以通过视频生成播客。紧跟时事(本来想发给它麦琳的十大名场面,可惜基于视频的生成目前还只支持英文字幕),我给在 YouTube 上找了 OpenAI 第 3 天的直播录像发给了它,让 AI 主播们来聊聊最新发布的 Sora(听说实测一言难尽,感兴趣的可跳转:别吹 Sora 了,实测一言难尽。甚至分不清人脸和猪??)。


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...


有一说一,GenFM 的英语口语还是地道的哩。


不过没想到吧!GenFM 不仅能将文字升维成更轻松的音频,还可以把视频降维成更简单的音频,以后看视频吃个瓜,还能有两个伴和你一起唠嗑,别提有多热闹了 ~


GenFM 的应用场景还有很多,我估摸着聪明的小伙伴们心里早已有了想法,欢迎留言分享你们的播客作品!


后记


AI 火了后,文字总结成为最先被广泛应用的场景之一。它通过提炼文字内容的核心信息,帮助用户快速理解复杂内容,解决了信息量过载和时间碎片化的问题。然而,这种方式虽然高效,却在形式上局限于“吸收信息”的单向互动,缺乏趣味性和代入感。


而我们今天分享的 GenFM 功能,就打开了另外一条思路:通过对话为主的播客形式,将内容的价值延伸到更丰富的场景体验中,让内容更有温度。


不仅如此,在我看来,对话这种形式,更能复现出内容的产生背景。试想我们写的文章、论文,难道不都是在一次次自己与自己、与同学、与老师的交流中产生的吗?如果能用对话的形式,将复杂的内容通过角色间的讨论重新呈现,听众是不是会获得更深刻的理解呢?


从文字到音频,技术的发展总能在意想不到的地方开花,为我们又带来了新奇的体验。GenFM 这类创新展示了 AI 在内容交互领域的无限潜力,在未来,AI 技术可能会进一步提升对话的智能化程度,比如实时生成个性化的播客内容,作为嘉宾直接参与到 AI 的播客互动中,等等。


让我们继续保持对 AI 技术的观察吧,咱们下期再见 ~


文章来自微信公众号“夕小瑶科技说”,作者“土Bo鼠”


发现一个好玩的AI播客生成工具,嗯嗯啊啊实在太像人了...

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales