提到PPT,多少人的DNA动了?
我们都曾有过这样的经历:为了一个项目汇报,在电脑前一坐就是大半天,逐字逐句地构思,再一张一张地手动设计幻灯片。从字体大小到图片排版,反复调整,耗时耗力,极其考验个人的设计能力。
然而,尽管制作过程如此“折磨”,它却又是我们工作和学习中绕不开的一环。它的应用场景极其广阔,几乎无处不在:
可以说,PPT已经成为现代信息社会的核心表达方式之一。
也正因如此,一场围绕着它的“效率革命”早已悄然开启。
今天,我们就来深入聊聊,AI是如何把PPT这个“磨人的小妖精”,变成越来越难用的。
开篇:那个让我们又爱又恨的PPT
提及“演示文稿”,Microsoft PowerPoint几乎是其代名词。
但可能很多人不知道,它的发明者丹尼斯·奥斯汀(Dennis Austin)最初给它起的名字,其实叫“Presenter”。
PowerPoint的发明者丹尼斯·奥斯汀
1987年,它的1.0版本在一个黑白屏幕的Mac上诞生,为世界带来了合并图形、剪贴画和多字体的革命性功能。
同年,微软收购了这家公司,一个软件巨头的传奇由此开启。
三年后,Windows版的PowerPoint发布,并正式成为微软Office套餐的核心成员,最终统治了全球几乎所有办公室和教室的屏幕。
但这份统治,也带来了长达数十年的“痛苦”。我们都经历过:为了找一个合适的模板通宵达旦,为了让几个图标对齐而眼花缭乱,为了一个动画效果反复调试……
其实介绍到这里,你可能还不知道PPT是什么?
PowerPoint 是一个面向页面的应用程序。各个页面(也称为幻灯片)有广泛的设计选项。包括文本、图形、表格、图表、多媒体内容(如视频和声音)的幻灯片。
PPT很重要,但做PPT真的很苦。
正因如此,当AI浪潮袭来,无数人都将“AI+PPT”视为解放生产力的终极答案。
但现实果真如此吗?
今天,我们就来深入聊聊,AI究竟是把PPT这个“磨人的小妖精”,变成了神器,还是一个更难用的“新物种”。
两种主流路径:AI原生派 vs 传统革新派
通过对市面上多款主流AI PPT工具的深度使用,我发现它们主要走了两条路。
1. AI原生派代表:Gamma——重塑工作流的“新贵”
Gamma是我个人非常喜欢的一个产品,它不仅仅是PPT工具,我甚至拿它做播客提纲和个人网页。
它代表了一种全新的思路:忘掉传统PPT,用对话生成一切。
Gamma生成PPT的界面,对话框和卡片式结构
它的交互流程和传统PPT完全不同。
开始前,你最先要确定的,是内容大纲。
这好比一座宫殿的地基,AI会引导你先确认好这个核心骨架。这种“模块化”的大纲构建和修改方式,非常人性化,在源头就减少了后期大量的返工。
确定大纲后,AI便会施展魔法:
Gamma的体验是颠覆性的,它试图让你完全忘记过去做PPT的习惯。
因为大家使用PowerPoint 的生产习惯没有变,不能说AI来了就重新塑造一个AI+PPT的全新工作习惯,
还是原来的那套生产流程,只不过是在此基础之上,多了PPT+AI的概念,用AI的能力,去把其中一部分环节给解决掉,于无声中润无声。
最终生成的PPT我也导出了,可以看看效果。
如上所说,PPT+AI的流程,其实在各种素材生成方面,做了很多尝试。
仔细看这些,这不就是传统PPT里面的常见的功能吗。
文本标题、布局、表格、图表、表单按钮、图片视频和媒体等。
2. 传统革新派代表:WPS AI——润物细无声的“实干家”
如果说Gamma是想“重新发明轮子”,那WPS AI走的则是另一条路:不改变你的习惯,只在你需要时伸出援手。
我用同样的需求让WPS AI生成PPT,体验截然不同。
首先,它生成的大纲非常“懂中国人”,封面、目录、章节页、致谢页一应俱全,完全符合我们长期以来的使用习惯。
其次,它提供了丰富的模板库,甚至支持企业自定义模板——这对于需要保持品牌视觉统一的公司来说,是绝对的刚需。
如上:模板的3个不同功能
最终生成的22页PPT,排版合理,图片也全部由AI生成,规避了版权风险。最关键的是,所有内容都可以在我们熟悉的WPS Office里进行二次编辑。
这正是我认为现阶段AI做PPT最好的两个赋能点:
AI应该是“润物细无声”地融入,而不是强行重塑用户几十年来养成的习惯。
即“新产品不是用来教育用户的”。
“模板”是护城河吗?AIPPT的“最后一公里”难题
除了上述两派,市面上还有大量创业公司在做AIPPT产品。
他们的模式大多是:让用户选择一个精美的模板,然后将文字内容套进去,一键生成PPT。
那么问题来了,他们的护城河在哪里?是海量的、覆盖各行各业的精美模板吗?
某种程度上是的。一个好看的模板,确实能解决70%的“颜值”问题。
但这只是入门级。用户真正的痛点,在于最后一公里:
能不能精细化二次编辑?
AI一次性生成的稿件,几乎不可能100%满足每个人的个性化需求。用户能不能像在PowerPoint或WPS里一样,方便地调整每一个细节,至关重要。
AI PPT生成:选择模板
AI PPT生成:PPT生成
AI PPT生成:PPT二次编辑
能不能完美导出兼容?
演示文稿最终是要拿去汇报、交付的。能不能正常导出为.pptx格式,在老板/客户的电脑上(无论是PowerPoint还是WPS)打开时,格式不乱、字体不变、图片视频都正常显示——这才是真正的考验。
很遗憾,我测试的多款产品,包括Manus、Genspark等工具生成的PPT,在二次编辑和格式兼容性上,或多或少都存在问题。这使得它们目前更像一个“玩具”,而非可靠的“工具”。
接下来展示的是Kimi他们自己做的PPT,和AI PPT一个原理,但是PPT二次编辑这块比较欠缺。
所以站在用户的角度,我肯定是在除此体验之后,选择最好的那一款AI PPT。
Kimi+ PPT生成:选择模板
Kimi+ PPT生成:生成PPT
通用大模型“跨界”做PPT,效果如何?
最近,许多通用型AI Agent(智能体)也加入了战局,比如Genspark、Skywork,甚至Flowith。它们通常以任务规划和执行为主,生成“幻灯片”只是其功能之一。
Manus通用智能
Manus是一款能够生成PPT的AI工具,其工作流程遵循了比较标准的“大纲优先”模式。用户在提供需求后,它会首先生成一份内容大纲,然后基于这个框架去创建完整的演示文稿。
然而,在实际体验中,它暴露出了通用型工具在“最后一公里”上的典型短板。
用Manus生成的PPT在二次编辑和格式兼容性方面存在或多或少的问题。当你想对AI生成的内容进行精细化修改,或者需要将文件导出到PowerPoint、WPS等专业软件中进行最终交付时,可能会遇到格式错乱或内容不兼容的风险。
这使得它在现阶段,更像一个用来快速产出内容框架的“玩具”,而非一个能确保稳定交付的可靠“生产力工具”。
Genspark超级智能体
Genspark是近期一个热度很高的智能体产品,它同样将生成演示文稿的功能纳入了自身的能力版图,不过在其内部,该功能被称为“幻灯片”。
它的工作流程与Manus类似,也是先为用户生成一个内容大纲,让用户对整体结构有一个清晰的预期,然后再基于这个双方确认过的大纲去创建完整的演示内容。
作为一个功能全面的智能体,Genspark在这一特定任务上的表现中规中矩,能够完成从创意到基础稿件的生成。
生成过程会出现图片引用缺失的问题,更加像是一个数据分析报告。。。
Skywork:AI Office智能体
Skywork作为一个更纯粹的通用Agent,其核心优势和产品逻辑在于强大的任务规划与执行能力。
虽然它也能完成生成PPT的指令,但体验下来,它不像专业工具那样有明确、独立的“大纲生成”步骤。
它的制作流程更像是完成一个综合性任务的其中一环。
比如,你让它“分析市场并做个报告”,它会拆解任务、搜集资料、进行分析,最后将结果以PPT的形式输出。
因此,它在PPT的结构化和设计专业性上,与那些专门为此设计的工具相比,显得不那么精细,优势在于内容比较准确丰富,得益于它接入的搜索MCP服务。
Flowith Neo:无限智能体
在这次的测评中,Flowith的Neo定位则非常明确——它并不适合用来制作PPT。
这并非说它不是一个好工具,恰恰相反,它在其他领域表现出色。
无论是撰写结构复杂的长篇文章、进行深度的主题调研,还是辅助开发网页,Flowith都能提供强大的支持。
但术业有专攻,制作演示文稿显然不是它的核心特长。强行用它来做PPT,效果会远不如其在专业领域内的表现。
这是测试的一个case:https://flo.host/hIjcbsb/
智谱z.ai AI Presentation
值得关注的是智谱AI (Z.ai)海外的Z.ai站点,近期也在公测一款能做 AI Presentation 的新模型:GLM-Experimental。
已经上线 chat.z.ai官方网站。智谱海外z.ai的AI Presentation工具有两个清晰的定位:
AGI什么时候养我?
我是个游戏行业从业者,帮我生成一份王者荣耀VS英雄联盟的PPT
画风过于炸裂,截取了其中的几张幻灯片如下。
秘塔搜索:塔子老师
还有一个AI PPT异类:秘塔的塔子老师。
本身秘塔是做AI搜索的,后来增加了“今天学点啥”板块,让搜索有了目的,内容有了温度。
现在秘塔搜索不仅支持以互动网页、海报、PPT的方式查看搜索结果,
也上线了“听讲解”功能,以AI的方式讲给你听。
每次课程结束之后也有对应的课程考题,活学活用。
体验下来,结论很明确:术业有专攻。
这些通用Agent可以快速生成一个内容框架,但无论是在设计专业度、编辑灵活性还是格式兼容性上,都与专门的AI PPT工具有明显差距。比如Flowith的Neo,它更擅长写长文、做调研,做PPT显然不是它的特长。
头部的AI大模型厂也在积极布局这一细分赛道,未来的竞争格局或许会更加激烈。
说在最后
别听他们吹,适合你的才是最好的
经过一轮深度体验,我可以负责任地说,AI PPT的时代确实来了,但它远没有宣传的那么完美。
最后,想借用我的一段“吐槽”来结尾,我觉得这说出了很多人的心声:
“很搞笑的是,很多人是搞‘AI+X’创业,但是没有X行业的经验。
他们用AI的能力去做一堆产品,却甚至没搞清楚用户群体是谁,没弄明白用户的核心痛点到底是什么……这样的产品,注定走不远。”
说白了,再酷炫的AI技术,如果不服务于人、不理解真实的工作流,终究只是空中楼阁。
文章来自公众号“AIGC新知”,作者“绛烨 ”
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/