上个月我和黄叔在视频号连麦,顺手注册了这个公众号。说实话,当时心里没底,也就是抱着试一试的心态。
没想到,短短几天,后台涌进了3000位新朋友。
看着粉丝数跳动的时候,我其实挺感慨的。在这个流量焦虑的时代,这份信任太沉甸甸了。首先要真心谢谢这3000位朋友,是你们让我觉得,认真分享点东西,依然是有价值的。
那天直播里,大家对一个玩法特别感兴趣,怎么用 Claude 的 Agent 能力结合 Obsidian,搭建一套一键写作和发布的工作流。

很多朋友在后台催更,问能不能详细说说。
今天,我们就把节奏慢下来讲一讲这个工作流以及背后的实现逻辑
首先大家来看下这个视频演示吧。

我们回到这个工作流
在这个场景里,逻辑其实很清晰。输入端,可以是一句需求、一个模糊的想法,或者干脆丢进来一条文章链接。
Claude Code 开始在后台疯狂运转,它不是简单地文本生成,而是一个经验丰富的编辑,先去提炼金句,构建骨架,再扩充文章。
紧接着,它会裂变。
不仅仅是一篇文章,它会根据同一个核心素材,生成三篇风格完全不同的初稿。有的侧重技术硬核,有的侧重感性故事,有的侧重商业分析。并且,每一篇都会使用nano banana自动匹配好精美的封面图和文章配图。
最终的输出端,则是N篇风格各异的文章,每篇都自动配好图片、规范落库、可一键发布。
整个过程非常流畅,就像水流过管道一样丝滑。
几分钟后,我在 Obsidian里,就能看到这次创作的全部成果。文字、图片、排版,整整齐齐地码在那里。
比如大家看这个例子,我把Anthropic博客的链接发给他,没有新增任何额外的指令,经过几分钟后他生成了三篇文章.
Obsidian右侧有一键发布,可以一键发布到公众号,并且可以选择公众号,不需要市面上复杂繁琐的appId和secret的配置,只需要一次扫码验证,后面就可以在这里选择对应的公众号。
并且可以选择不同的模板,调整样式字体大小等
点击发布之后就可以保存到公众号的草稿箱了,同样可以点击复制然后去手动发布,不过还是建议直接一键推送到草稿箱,毕竟是真方便那。

甚至如果我不需要复核审阅的话,我只需要告诉cc一句指令:“请帮我发布到我的公众号【李默AI实战】,在不依赖 Obsidian 的情况下也可以成功发布”。
大家看这个流程是不是很丝滑?
当然我们还可以一键分发到我们不同的平台,比如小红书
我们继续点击小红书预览,可以看到,刚刚这篇文章已经完全变成了小红书图片,我们可以选择样式,比如备忘录样式,推特样式,纯图片样式。
也可以选择背景图、配色等等。
然后,我们就可以把这些图片发布到小红书和小绿书了,是的,大家看截图:

也可以切换不同的图片风格,比如备忘录风格,推特推文风格,也可以选择不同的背景底色、修改字体,大小、自定义图片样式等。比如我把他改为备忘录风格:

也可以选择不同的图片边距,调整不同的尺寸大小,和比例等:


我们确定图片没问题之后,可以发布到小绿书或者小红书,比如我点击小绿书,会跳出弹窗,选择我的公众号,任意选择一个公众号,这些图片就已经发布到我的公众号的图文草稿箱了,只需要在“订阅号助手”手动点击确认发布就可以了。

同理,我们点击发布到小红书之后会跳出一个二维码,我们只需要使用小红书APP扫描一下二维码,就会直接跳转到红书草稿箱,最主要的是,不需要担心封号,因为完全是官方通道!
整体效果看起来是不是还挺顺畅的?
我们可以明显地看到,从写作开始,它的背后执行了一套的工作流
那这种形式和传统的n8n coze这种拖拽是有什么不同呢?
对,他是一种对话式的工作流,我们下达指令后,它就能按照意图自动执行一系列流程。
这种工作流如何实现的呢?
这背后,其实就是 Claude skill
那什么是Claude skill ?
skill 和传统的工作流有什么区别 ?
如何实现Claude Skill?
Claude Skill 能解决什么问题?
后面可能写更详情的文章的篇幅给大家讲清楚什么是Claude skill ,这里我们先简单介绍下Claude Skill。
我们举个例子,在工作中,有两个员工
员工A是万金油型选手,什么活都能接,学习能力也很强。但每次接到新任务,他都要从头摸索,让他做财务报表,他要先问你用哪个模板;让他导出一个PDF,他要现场研究半天工具。能力没问题,效率却始终上不去。
B是老员工,手里有一套完整的工作手册。做财务报表?他知道打开财务模板.xlsx直接填。导出PDF?行,他可以直接打开对应的工具秒搞定。为什么?因为之前有人把流程、工具、模板都整理好给他了。
这些流程、工具、模板,都是前人反复打磨后留下的最佳实践。
AI现在大多数时候,就是那个A,不是AI不够聪明,而是它缺少专业化的工作方法。
它聪明,但每次都要临场发挥,输出不稳定不可控,而我们真正需要的,是那个B,是那个拥有工作手册、配备专业工具、知道如何高效完成具体任务的专业选手
这就是Skill的本质,就是给AI做一次入职培训。
那到这,我们理解了Skill 的基础概念,那Skill里装的是什么?
Skill 里主要有三样东西:
1. 工作流程说明书(SKILL.md)告诉AI遇到这类任务,按这个步骤来。就像你要告诉你的新员工,在手册里写好如何处理客户投诉,如何走报销流程,如何写财务报表。
举个例子:我们需要让AI帮助我们生成不同公众号的文章,那在这个说明书里,你会写清楚:第一步读取用户的链接获取正文 -> 使用至少三种风格进行创作 -> 创作完成后使用nanobana进行新增配图,
2. 可执行的脚本(scripts/)有些事不需要AI每次重新写代码,比如压缩图片、查询数据库、账号同步等等。直接给它一个写好的脚本,调用就行。
这就像给员工配了一套带有办公软件的mac电脑,不用他每次都申请极其,然后手工重新安装操作系统,安装办公软件。
3. 参考资料和模板(references/ 和 assets/)
references/:存放背景知识。比如不同的风格,不用每次都把这些信息塞进脑子里。assets/:存放模板文件。比如PPT模板、Logo、字体、前端代码框架。AI直接拿来用,不用从头搭建。**这三样东西加在一起,就是一个完整的 skill
用一个更接地气的比喻
你看,这不就是一个新员工入职时拿到的全套资料吗?
因为AI只有算力,没有阅历,所以那些存放在references里的行业黑话,那些写在scripts里的避坑指南,那些沉淀在SKILL.md里的业务逻辑SOP,才是你真正的护城河。
在上周,Anthropic发布做了一期视频,标题就是 Don't Build Agents, Build Skills Instead。什么意思呢?中间也提到,AI 的真正落地,不在于构建万能智能体,而在于组合各种不同的专业Skill
那我们为什么需要Skill呢?
你有没有遇到这种问题,就是AI很聪明,但是总在重复的事上翻车?
答案也很简单,就是AI的通用能力很强,但流程性和程序性知识需要被装进去。
什么是流程性程序性知识?
就是那些知道怎么做的隐形知识,也就是我们的SOP,这不是原理,而是流程、步骤、最佳实践。
举个对比:
skill 解决的,就是流程性隐性知识的打包和传递问题。
AI 天生是通才,但我们的工作需要的,往往是在某个具体场景下的极致效率和稳定的可控性。
核心思路就是把那些需要重复做的事、需要特定知识的事,打包成一个工具箱和使用说明书,让AI下次遇到时直接调用。
我自己也在尝试一个思路,每当我完成一个复杂的项目,我就问自己:"如果我要把这件事交给明天的AI去做,我能不能把他标准化,我需要给它准备什么工具?"
这个过程本身,就是一次极高价值的复盘。
也许不是每个人都会写代码,但每个人都应该学会技能化的思维。 别让你的经验只停留在脑子里,把它写出来,打包好,这就是一个标准的skill。
这件事给我最大的启发,不仅仅是怎么用AI,而是:好的工具不是拿来就用的,而是需要被培养的,要让他更懂你。
类比到我们自己的工作:
你有没有发现,新来的同事总是问同样的问题?不是因为他们笨,而是因为没人给他们一份最佳实践手册。
你有没有发现,自己总在重复做同样的事?不是因为事情简单,而是因为没把这些流程固化下来。
好的组织,会把经验变成可复用的skill。好的个人,也一样。
本质上,都是在做同一件事:把那些反复要做的、容易出错的、需要经验的事情,整理成可以直接调用的工作流程。
不是每次都临场发挥,而是有一套自己的工具箱。
AI很强大,但它不是拿来就能完美工作的员工。
为什么?它需要被培训,需要被装备,需要你把你的工作方式、工具、流程教给它。
这个过程可能有点麻烦,但一旦建立起来,效率的提升是指数级的。
有人能告诉我们AI最终会进化成什么样。
但有一点是肯定的:未来的高手,不是自己干活最快的人,而是那个手里攥着最多Specialized Agents 的人。
不急于求成,但要开始把你的经验,变成别人拿不走的skill。
我们了解了Claude Skill 是什么,那在内容生成这个场景下,我们如何实现这个自动化工作流?
这里我们推荐一个官方的skill创建工具:
https://github.com/anthropics/skills/tree/main/skills/skill-creator
我们打开Claude Code,直接在对话框里这么说:
/skill-creator
请你帮我创建技能:rewritepost
【核心功能】
根据用户输入的主题/内容,自动生成三种不同写作风格的文章,每篇配图,输出为Markdown文件,便于后续在 Obsidian操作。
【三种写作风格】
1. 娓娓道来风格 (narrative-style)
- 占位提示词:{{NARRATIVE_PROMPT}}
- 特点:温和、循序渐进、引导式叙述
1. 犀利点评风格 (critical-style)
- 占位提示词:{{CRITICAL_PROMPT}}
- 特点:观点鲜明、论证有力、批判性思维
1. 故事描述风格 (story-style)
- 占位提示词:{{STORY_PROMPT}}
- 特点:场景化、情节化、沉浸式体验
【执行流程】
1. 接收用户输入主题
2. 针对每种风格:
a. 使用对应提示词生成文章内容(800-1500字)
b. 提取文章核心概念,生成图片描述提示词
c. 调用即梦 4.5 API生成配图
d. 组装MD文档(标题+配图+正文+元数据)
3. 保存三个文件到当前目录
【图片生成配置】
API调用示例:
curl -X POST https://ark.cn-beijing.volces.com/api/v3/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $ARK_API_KEY" \
-d '{
"model": "doubao-seedream-4-5-251128",
"prompt": "[根据文章风格动态生成的图片描述]",
"sequential_image_generation": "disabled",
"response_format": "url",
"size": "2K",
"stream": false,
"watermark": true
}'
【图片提示词生成规则】
- 娓娓道来风格:温暖色调、平和场景、教育感
- 犀利点评风格:对比强烈、视觉冲击、概念化
- 故事描述风格:戏剧性、情境化、细节丰富
【输出文件规范】
文件命名:
- {topic}_narrative.md
- {topic}_critical.md
- {topic}_story.md
我们打开Claude Code 输入我们的提示词:

稍等片刻,我们看到Skill已经创建成功了

我们使用VSCode打开新创建的Skill文件夹,可以看到这里有对应的skill.md说明书,有script 和 assets 文件夹,并且包含了指定的流程。

这个时候我们来测试一下:
稍等几分钟,我们可以看到Obsidian中已经包括了这几篇文章了,我们在右侧对应的插件处可以点击发布到公众号,这时候选择指定的公众号点击确认,就可以直达草稿箱了。
关于插件如何做,在接下来几篇文章中,我也会给大家进行详细的拆解。大家可以点赞关注,期待后续。
文章来自于“李默AI实战”,作者 “李默”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales