当我用Codex做PPT,这可能是目前最好的解法之一。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
当我用Codex做PPT,这可能是目前最好的解法之一。
7570点击    2026-05-01 10:50

当我用Codex做PPT,这可能是目前最好的解法之一。


嗨大家好!我是阿真!


朋友们,好像标题党了,先别骂,看完指定有灵感。整了点不错的东西,这次真的可以把 PPT 做得很好看了!快放假之前给大家再分享一波,这个真的很棒的不容错过。


首先我其实是很早就想做这个的,我之前分享的 Coze 的技能那篇文章,我做了一个技能叫【PPT风格克隆】,那时候我只有一个想法雏形,就是通过提取参考图或者参考网页的视觉细节,去进行这个风格的参考,然后把风格迁移到我的 PPT 生成的流程里,完成 PPT 的输出。


当时我虽然在 Coze 也做出来了,但是操作起来还是有点困难的,要自己比较熟悉什么参考图适合什么风格,不然迁移效果就差了点。刚去看了只有 5 个人给技能评分,还都是给1分(最低1分)😅


而且我属于有点强迫症的那种,我不能接受它很多细节不统一,虽然它们单看都还不错,但是在一个 PPT 里的话,它们的那种视觉上的一致性是不够好的。


比如下面这两张,虽然是一组生成的,但是黑色部分的框就是一个是方框另一个是凹角边框。或者很多场景下的单页的小标题的装饰是差别有点大的。👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


那有没有解决办法呢?以前不那么好解决,但是现在我觉得又可以了。主要还是 Codex 支持了 Image 2 大大加强了我的探索欲,我探索出了一个很棒的可以用来做 PPT 的 Skill,可以很好地去迁移参考图的风格,做出自己想要的 PPT 效果。


几乎任何风格,都可以让 Image 2 为你迁移。


给大家先看看输出效果。这次风格参考的图片来自网站 Landbook(https://land-book.com/),虽然它主打网页设计灵感库,但是视觉的亮点都是共通的,它分享的网页图的版式效果也是非常值得学习的。


这是给到的参考图👇


当我用Codex做PPT,这可能是目前最好的解法之一。


原图链接:https://land-book.com/websites/71866-doconomy


输出 PPT 图片的时候,我的逻辑是先输出多宫格图,把基本的版式定下来,后续它再一个个放大,而 GPT Image 2 不让人失望的一点就是它放的的时候不但基本遵循了版式,在多宫格时候一些处理不好的地方它放大之后反而有可能进一步优化,这一点我觉得是 Nano Banana Pro 做得有点不如它的。但是人像和角色相关还是 Nano Banana Pro 更好。这个在最后一个案例可以看出来。


先看多宫格👇


当我用Codex做PPT,这可能是目前最好的解法之一。


再看完整的输出👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


这是给到的参考图👇


当我用Codex做PPT,这可能是目前最好的解法之一。


https://land-book.com/websites/93690-golive-webflow-ecommerce-website-template


这是参考参考图的输出PPT,基本都不用怎么修改。哎,你怎么知道我五一要去甘肃玩的哎嘿🐶👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


这个也是。前面几组简约点,后面几组复杂点👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


还有这个👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


还有这个👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


虽然依然不能说很完美,但是整体的调性和细节还是不错的了。


思路分享


再和大家分享我这个 Skill 的工作过程和我的思路。


首先这个 Skill 不是做可编辑 PPT 的路线,走的路线还是“先把视觉风格资产化,再用 Image2 生成整页图,最后封装成图片版 PPTX ”。这主要还是依托 Image 2 自身强大的能力实现的。


下面是我的思路(这个风格是这个 Skill 的默认风格)👇


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


1. 判断任务类型:GPT首先会判断是提炼风格、调用风格库、文档转 PPT/图片、已有图片版 PPT 返修,还是单页视觉重做。


2. 选择或提炼风格:明确只使用一个 Style source (用于参考风格的资源)和一个 Style Lock(锁定视觉细节),防止混入历史参考图或其它风格。


3. 理解内容:从文档或主题里抽出一句话主张、受众、3-6 个核心观点、可视觉化对象和建议页数。这一块是为了PPT 的内容作准备。


4. 确认生产参数:页数、比例、输出类型、语言、文字密度、是否需要日期/作者/Logo/水印。默认是中文优先、16:9、低密度、无日期。这里是锁定视觉细节。


5. 规划页型:从封面、目录、核心观点、对比、流程、框架、时间线、数据、案例、清单、结论等页型中为每页定角色。这里也是锁定视觉细节。


6. 先产出文档:多页项目前必须先生成 outline.md(这个是内容框架) 和 prompts.md(这个是完整提示词),其中 prompts.md 要包含完整 Style Lock(这是为了统一多图的视觉细节)。


7. 两段式生成:多页项目优先先做缩略图板锁定整体节奏,再逐页生成独立成品图。这里选择了先做一张多宫格图,用于更好地保持不同页面的图片版式的一致性。


8. 用户确认图片:生成后先展示或列出图片,确认通过后才组装 PPTX 和 zip。


9. 局部返修:重做被点名的页,保留其它页和同一风格系统。


10. 最终打包质检:检查风格一致、中文可读、信息不拥挤、页型匹配、无黑色外框、无假日期、一页一图、PPTX 全屏铺图。


如何使用


推荐工具首选 Codex 。因为它足够聪明,能够很好地理解并输出我需要的文本内容,还能批量完成极高质量的带有文本的图片。如果无法使用,同样可以尝试 Lovart 、LibTV 或扣子来完成。


首先还是安装这个 Skill,或者直接把我最后的链接复制给 Codex 让它安装就行了。顺带说一句这里打码是因为是个无关的 Skill,不是特地藏私,这个调好了下下期就分享了,也是很有意思的小工具😁 👇


当我用Codex做PPT,这可能是目前最好的解法之一。


安装好以后,让它调用这个识别图片做PPT的 Skill 或者直接让它调用 visual-style-ppt Skill,给到它想要参考和模仿风格的图或者直接给网页链接也可以,并且和它说,提取这张图的风格 DNA ,然后它就完成了提取👇


当我用Codex做PPT,这可能是目前最好的解法之一。


原图与原图链接👇


当我用Codex做PPT,这可能是目前最好的解法之一。


https://land-book.com/websites/84950-error-the-request-could-not-be-satisfied


好,风格已经提取好了,接下来就是给到指定路径的文档,或者文档附件,让它生成 PPT。如果没有文档直接让 Codex 去找资料也一样的。


但是在这一步它还不会生成 PPT,它会首先生成第一步文件等我们确认,这一步会生成一个 outline 文件,一个 prompts 文件。


当我用Codex做PPT,这可能是目前最好的解法之一。


outline 文档其实就是 PPT 的文本大纲,为了内容更加可控,我的想法是把这个文档先单独输出出来进行确认,内容大纲上还有任何问题的时候,可以选中内容然后【添加到对话】修改。这个后面有截图示意。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


然后是 prompts ,这个相信大家都很熟悉了,这个就是提示词,不同的是,在这个提示词前面我做了详细的制作参数标准的默认与统一,以及Style Lock,也就是将风格和层级的细节狠狠锁死。


当我用Codex做PPT,这可能是目前最好的解法之一。


再往后,就可以看见缩略图、每张PPT的详细提示词了,之所以这样做也是想让风格和内容在内容阶段就都更加可控。


当我用Codex做PPT,这可能是目前最好的解法之一。


等上面 2 个文档内细节确认了,就可以让它生成图片了。就对它说“生成图片”或者“继续”就行了。生成图片分了两步,先出多宫格,不满意就修改到满意,然后再一张一张输出。下面我这个内容很简短,所以只有 7 张图。如果是 PPT 内容比较长的,可以考虑让它分成多次去完成。


当我用Codex做PPT,这可能是目前最好的解法之一。


文档原文来自:https://substack.com/home/post/p-186699129


当然,如果你觉得上面这些都虚头巴脑的,费那老大劲!那也可以直接让它输出 PPT 图。这个主要还是为了细节可控。


最后的大图和九宫格的缩略图可能还是有点差别的,但是在我的尝试中,它变化的方向通常是往更好的方向,所以都还是可以接受的。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


第一轮所有图片输出以后其实还是可以继续进行调整的。比如这个原图序号错了,我让它继续修改。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


但是还是老问题哈 Image 2 这个人像细节。


如果还有其他文字细节要修改,可以截图框选给她让它修改。


当我用Codex做PPT,这可能是目前最好的解法之一。


当我用Codex做PPT,这可能是目前最好的解法之一。


然后图片也确认完了,可以直接让它导出 PPT,或者直接说“打包” 。它会交付最后确认的所有的图片、缩略图版、大纲、提示词文件。不要误会,这里的 PPT 其实还是那个无法修改文字的图片组合在里面的。有需要修改的,一定在前面一步修改完了再打包压缩包。


当我用Codex做PPT,这可能是目前最好的解法之一。


最终输出的压缩包里是这样的👇


当我用Codex做PPT,这可能是目前最好的解法之一。


其中 Style-used 是可复用的风格模板。它是给后续生成、返修、复用看的风格设定文件。它的作用如下(你看,我再次生成信息图的时候调用了同一个风格模板,它的风格一样维持得很好)也就是说,我们如果还要加 PPT 页面,直接在这个基础上补内容也是完全 OK 的,绝对不是只能九张以内的👇


当我用Codex做PPT,这可能是目前最好的解法之一。


如何使用 · 文字版


最后再次简单概括怎么使用:


第一步,在 Codex 安装这个 Skill。


第二步,给它参考图,让它提炼风格 DNA 。


第三步,给它我们的文档,让它基于文档生成 PPT 图片。这一步会生成两个文档,修改确认好以后,再进行下一步。


第四步,检查和修改图片细节,没有问题后让它打包文件。


第五步,Style-used 文件,下次还可以复用,觉得有用可以让它直接存到 Skill 里。


当我用Codex做PPT,这可能是目前最好的解法之一。


小结


好嘞,到这里,我的整个思路和它的操作方法也差不多分享完了,以后大家如果想迁移自己一直惯用的一些风格到要用的 PPT,或者做一些实验性的PPT 风格的尝试等等,也都非常方便了。


最后,这个 Skill 已经分享在 GitHub ,下面是链接,如果喜欢可以点亮阿真的 GitHub 🌟


https://github.com/irenerachel/visual-style-ppt-skill


创作不易,烧脑烧 token 咩哈哈,如果内容对大家有启发或帮助,欢迎给阿真一个免费的猛猛三连鼓励~!


马上放假了,阿真假期出去玩,可能整个假期不更新,预祝大家假期愉快呀😄


下期见!


文章来自于微信公众号 "阿真Irene",作者 "阿真Irene"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0