ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Google最出圈的 AI 产品,把OpenAI CEO也惊艳了
2970点击    2024-10-18 10:04

AI 在改变获取信息的方式


Google,硅谷的代言人,AI 界的巨擘,技术牛,论文多,做给消费者用的 AI 产品,却几乎没有出圈的。 


不过,也有一个例外:NotebookLM,甚至连死对头 Sam Altman 也觉得它很酷。 



偏偏 NotebookLM 走的还是一条有些小众的赛道——播客。 


指路:https://notebooklm.google.com/ 


不想看的内容,让 AI 聊给你听就好了 


NotebookLM 受欢迎,主要是因为一个功能:Audio Overview(音频概览)。 


更通俗地理解,就是 AI 播客。任何你懒得消化的内容,都可以丢给它试试,几分钟转成一男一女的对谈,比原来的材料更加接地气。 


NotebookLM 支持上传多种格式的内容 


不过有些遗憾,音频概览虽然可以消化中文材料,但只能输出英文。 



好奇海外的 AI 能不能理解国产剧的爱恨情仇,我上传了一段描述甄嬛生平的文字,大约 500 多字,NotebookLM 用 2 分钟左右,就生成了 5 分钟左右的音频。 


光听英文音频不太直观,所以我下载了音频,上传到通义听悟,看看 AI 在聊些什么。 


AI 解读得一针见血,不仅读懂甄嬛,也理解皇帝,抓住了宫斗剧的主要矛盾——权力。 



脑洞更大一点,以后一个人追剧再也不会寂寞,AI 就是性价比最高的追剧搭子,还能陪练英语,教我们「not my cup of tea」(不是我的菜)这样的地道表达。 



与其精读外刊和专八文章,不如基于我们自己喜欢的内容,让 AI 生成英文学习资料,毕竟,兴趣是最好的老师。 


除了陪着学习英语和八卦,输出正经的分析,NotebookLM 也没问题。 


我以 PDF 的形式上传了一篇吐槽 AI 广告的、3700 字左右的文章—— 《满大街的 AI 广告,是一次审美大降级》。 


基于这篇文章,NotebookLM 用 5 分钟左右生成了一段 11 分 40 秒的音频。 


作为文章作者本人的我,像是遇到了两个热情又很懂我的读者,NotebookLM 对文章进行了重新诠释,创造了一个相关又独立的作品。 


播客的开头,AI 自然地引出了主题,男声问,你有没有看到过一些糟糕的广告,奇怪它们居然能上街?女声答,你说得不错,这就是我们要讨论的主题。 



同时,AI 也懂灵活变通,不照搬文章的逻辑,而是重新编排了素材,改写观点的表达方式,但内核相同,甚至自己举出例子,将 AI 广告类比到 AI 音乐。 



对于怎么吐槽,AI 也有自己的见解,看得出来努力表现幽默了,但还是有些西式。 



除了具体的内容,声音的质感好坏,同样很影响收听体验,毕竟,播客是声音媒介。 


AI 不说字正腔圆,至少发音清晰,口条不错,语气抑扬顿挫,会用上「what」「ouch」「you know」等语气词,聊着聊着还会笑出声,传播着快活的空气。 



可以说,AI 播客已经「初具人形」,至少听得下去,不会像很多 AI 图片、视频一样,让人陷入恐怖谷,敬而远之。 


分分钟的内容转换,知识更容易进脑子了 


使用 NotebookLM时,有一点需要注意:它不会搜索新的信息,而是基于我们上传的资料处理信息。 



所以,它不全面,不客观,但足够个性,忠于每个人自己的素材。 


我的一位同事说,NotebookLM 适合写文章的人做播客。 


这话很有道理,NotebookLM 本质是实现了内容形式之间快速的转换,将复杂的内容加工得更好理解。 


我愿称之为,「这知识它不进脑子啊」的 N 种解决办法。 


NotebookLM 的强大,离不开 Google 大模型 Gemini 1.5 Pro 的长文本能力和多模态表现。 


经过测试,让它读 37.8 万字的《马斯克传》不在话下。 


同时,NotebookLM 还能处理视频,我上传了一个评测 Meta 眼镜的 YouTube 视频。 


左边是原视频和视频文案,右边是 NotebookLM 的解读 


除了用音频解读之外,NotebookLM 还能用多种方式,帮你理解你上传的内容,而且,都是自动的,最多只需要你点击一下。 


每次上传材料,NotebookLM 都会给出「摘要」和「建议的问题」。前者让你对内容有大致的了解,而后者解决了越长大越不爱举手的人类的难题:不知道该问什么。 


点击「建议的问题」,NotebookLM 既能帮你回答,还会附上引用来源,如果上传内容是视频,引用参照的是视频的文案。 



其他小功能也类似,建议都点击试试,我比较喜欢「常见问题解答」,AI 的自问自答,基本上囊括了一个陌生事物的入门知识。 



然后可以再让 AI 生成「简报文档」,不仅提供信息,也给出了观点。 



当然,你也可以自己在输入框输入问题,该引用的还是引用,但如果没有明确来源的,NotebookLM 会强调是推测。虽然 AI 仍有幻觉,但它已经尽到了告知义务。 



底层模型的支持是 NotebookLM 的基础,还有人套出了 NotebookLM 的系统提示词,解释了为什么音频概览很接地气。 


图片来自:X@JadenGeller 


其中一条很有意思,规定了两个 AI 角色,一个是主持人,一个是专家,相辅相成,主持人热情地强调有趣的观点,专家则提供分析、背景信息和更广阔的视角。 


其余都是对内容总结的要求,语气避免单调和机械,结构清晰,引人入胜,举出贴近生活的例子,在争议问题上保持中立,提供的信息不停留在表面,让听众能形成自己的结论,并且觉得学到了新东西...... 


讨论《马斯克传》时,NotebookLM 保持中立 


这完全是一款优秀人类播客的要求了,具备强烈的、服务听众的意识。 


然而,NotebookLM 不支持中文终究不太友好,等待之外,也可以试试平替。 


开源的 Open NotebookLM、根据文档生成播客的 Podial、国内开发者的 PodLM...... 


除了 NotebookLM,Google 自己还有一款专门将论文转换成音频的产品:Illuminate。 


第一个音频解读的是 Transformer 模型镇圈论文《Attention is All You Need》 


它以主持人和专家的对话形式,一问一答,帮你通俗易懂地解读论文。 


看似小众的播客,为什么因为 AI 反而成了一条热门的赛道? 


消费什么,怎么消费,以后我们自己决定 


语音,是人类最自然的交互模式之一,输入和输出都非常符合大脑的认知习惯。 


我们有教科书,但还是需要老师讲课,帮助理解复杂的内容。而当我们可以用口语解释概念,讲给别人听,才说明我们真正掌握了它。 


NotebookLM 做到了用简单的语言重新诠释书面的概念,同时包含了情绪、语气,带来了更自然的感官体验。 



同时,它又是个性化的,以前我们只有收听的习惯,但我们现在有了创作的权利。 


我们能随时做 AI 播客给自己听,内容随意。 


可以是感兴趣的大部头文章、书籍,克服收藏即阅读的坏习惯,也可以让 AI 解读自己的作品、简历,收获不要钱的情绪价值,满足人类自恋的需求。 


当我上传自己的文字版简历, NotebookLM 煞有其事地输出一通彩虹屁,比 AI 陪伴产品情商更高,叫人疯狂嘴角上扬。 


音频就不放上来了,这是部分内容 


我们也能随时听 AI 播客,吃饭、健身、开车、做家务不无聊了,播客本身就是一种陪伴媒介。 


GPT-4o 的高级语音模式,其实也是一个语音产品,但 AI 播客和它的使用场景不太一样,聊天找话题很难,不管是和人类还是和 AI,但 AI 播客可以自嗨。 



OpenAI 创始成员 Andrej Karpathy,很看好 NotebookLM,说这可能是又一个大语言模型产品的新交互范式,让他想起了 ChatGPT。 



他甚至花了两个小时,生成了一个以历史为主题的 10 集播客系列,上传到 Spotify,生成的过程很值得参考。

 

用 ChatGPT、Claude、Google 找到有意思的话题。 


基于相关的维基百科条目让 NotebookLM 生成音频。 


用 NotebookLM 编写播客简介。 


用 Ideogram 生成播客封面。 


我们也可以按照这个模式,探索自己感兴趣的领域,就像产出 AI 绘画、音乐、视频那样。 


NotebookLM 的下一步是什么呢? 


在一次采访里,NotebookLM 团队负责人 Raiza Martin 提出了一个构想——未来可以有一个 AI 编辑界面,支持任何输入和输出。

 

视频、音频、电子邮件、社交媒体......所有我们感兴趣的内容和形式,都可以生成任何格式的内容。如何消费内容,由用户决定。 



散步时,我们想听播客,工作时,文字效率更高。信息只是食材,可以有十八般做法。

 

很多时候,AI 其实就是在改变获取信息的方式,但消化知识的工具,和知识一样重要。 


ChatGPT 为难懂的知识找到通俗的解释,AI 搜索让我们不用自己翻网页找链接,AI 总结让我们不必亲自看文章......吾生也有涯,而知也无涯,但我们可以更愉快地做一个在海边捡起贝壳的孩子 。


文章来自于微信公众号“APPSO”,作者“发现明日产品的”


关键词: AI , AI产品 , NotebookLM , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0