昨天写了一篇关于在扣子上使用Skills的文章。
里面用的案例,特别简单,就是把Github上一个非常经典的开源项目,封装成一个Skill,方便我们以后进行调用。

这么做的原因特别简单,就是我一直觉得,重复造轮子是一件特别呆逼的事情,互联网三十年,开源世界大神这么多,其实你能想象到的绝大多数需求,都有大佬和真神们,在前方铺路,做出了现成的产品,然后开源了出来,给非常非常多的人用。
其实现在非常非常多的一些商业APP,特别是一些所谓的格式工厂、压缩之类的,绝大多数都是把一些大佬的开源工具,做个前端,给大家用。
之前我觉得没啥问题,确实,Github上面很多的开源项目,都是没有GUI的,全部需要部署,部署以后还是用命令行操作,真的,光环境这一条,就能卡死绝大多数的普通用户。
我自己,之前就是被挡在门外的普通用户。
有太多太多好玩的、实用的、很屌的开源项目,我用不了了。
比如格式转化这破事,没有AI之前,我每次就是去Google搜,MP3转WAV...

然后就看着各种各样你也不知道是不是有刺客的链接,在向你招手。。。
所以,Skills一来,从文件结构上,它是可以把脚本和Prompt打包在一起的,这一点,跟单Prompt或者脚本完全不一样,再加上现在一些Coding能力强的基模和Agent,我觉得,它天然的擅长把很多的大佬们的开源项目Skill化,从而在Agent里面,为我所用。
而且你要相信那些历史悠久的经典开源项目,经历了无数的时间和使用者的鞭打,不管是成功率还是稳定性还是效率,都远超绝大多数的你根据需求,让AI临时去写的一些代码...
所以就搞了这么个东西,其实不止Coze,当你在OpenCode或者Claude Code这种支持Skills的产品里,只要你装了那个Claude官方那个能生成Skills的Skill,也就是
skill-creator,打包Github上的开源项目,也是完全没问题的。

这种方式,就能最快速度,越过所谓的本地整合包,变成一个类似于Agent的产物,让你能快速的用上。
比如昨天扣子文章中,我把视频处理的开源项目FFmpeg和图片视频处理项目ImageMagick,封装成了一个多模态素材处理的Skill,它大概就是这个效果。

然后呢,在文章中一个有趣的评论,引起了我的注意。

这个评论的问题没啥毛病,因为github上那么多开源项目,离大众肯定还是非常的遥远,我因为知道有特定的项目可以去处理特定的事,所以封装成Skill就特别的简单,但是大多数的普通人,可能连github是什么都不知道,那怎么封装呢?
这确实是个问题。
我当时想了两分钟,然后我一寻思,不对啊,这不都有AI了吗...
于是,我就回了一句:

没想到,引起了好几个朋友非常正向的反馈。

这个时候,我才意识到,其实,我的很多的小技巧,对于蛮多人来说,还是挺有价值的。
所以这块,我觉得我觉得可以单独拎一篇文章,来给大家讲一讲,普通人怎么把整个github,当成自己的弹药库,做成skill,让自己真正的,变得三头六臂无所不能。
比如,我自己现在,就已经封装了很多的skills。

哦这个管理skills的skill,也是我自己建的一个skill,要不然感觉每次进到文件里看太麻烦了,我就可以直接用这个skill,对我本地的所有skill进行卸载删除修改优化操作...
举一个例子。
我相信大家经常都有一个需求,就是去各种视频网站上,下载视频,比如Youtube、B站等等。
我自己也有。
那我们就可以直接打开ChatGPT,选中GPT-5.2 Thinking(目前我认为搜索能力最好、幻觉程度最低的模型),当然,你用别的也行,一般来说问题都不大。
然后直接提出你的问题:
有没有那种就是去各种视频网站上,下载视频,比如Youtube、B站等等的github上的开源项目。

在GPT搜索了一阵子以后,就会给你推荐一个,在github上,几乎封神的项目。

它叫做,yt-dlp。
github上143k的star,说是真神,也不为过。

支持上千个网站。

这,就是
yt-dlp,我觉得最伟大的项目之一。
你要相信,在这个世界上,在这个互联网上,有无数的大神和前人,已经为你铺好了前路。
你要相信,你的需求,永远不是这个世界上第一个提出这个需求的人,也绝对不是最后一个。
你要相信,人类在这几十年所积攒的历史,几乎覆盖了世界所有的领域,互联网,永远都是那个最深、最广的宝藏。
你要相信,在这一刻,你搜出来这个开源项目的这一刻,这就是人类开源精神的涓涓长河,在你面前展开的绝美的画卷。
我时常赞美这世界上,每一个愿意开源、每一个无私的将自己的知识分享出来的前辈们,正是因为他们,才让我们,能站在他们的肩上,去摘更美的星辰。
我们直接复制yt-dlp的github链接。
然后把这段Promtp发给你装好了skill-creator的OpenCode或者Claude Code:
帮我把这个开源工具https://github.com/yt-dlp/yt-dlp打包成一个Skill,只要我后续给出视频链接,就可以帮我下载视频。
这块如果还不懂或者不知道的skill-creator是啥的,可以去看我之前的那篇文章:
一般我的做法对打包,是先让Agent进行规划,然后再去写整个的Skill,这样我自己感觉,成功率会高一点、后期稳定性也会更强一点。
相对应的,OpenCode就是开启Plan模式。

然后,Agent就会开始调用skill-creator这个生成器,开始分析yt-dlp这个项目,然后开始规划要怎么打包封装成一个Skill。

规划了一通以后,OpenCode就分析完了,向我提出了几个问题。

我也给出了我的回答。

然后它就会继续规划,最终给我一个非常明确的计划。

我觉得没有问题了,这个时候,我就会切换到正式的开发模式。
也就是这个模式,然后发一句话,开始开发!

OpenCode就会开始了。
过了一会,大概2分钟以后,这个基于yt-dlp的视频下载Skill,就开发完成了。

我们试一试。
比如OpenAI刚刚出的Youtube访谈视频,我想下载下来。

直接就把链接扔给OpenCode就行,这里可以注意一个小技巧,就是所有的涉及到这种需要运行程序的Skills,在第一次运行的时候,都无脑推荐在OpenCode里使用GPT 5.2 Codex(如果你有的话),体验会比Claude 4.5 Opus好N倍。
大概就是:构建Skills的时候Claude 4.5 Opus,如果这些开源项目封装好了,在第一次运行的时候用GPT 5.2 Codex,后续就无所谓了。

第一次运行,其实会遇到很多问题,比如说Youtube防爬机制很强,需要你装个浏览器扩展导出Cookie,比如要安装一些其他的项目等等,不过这些AI都会指导你干好。

然后一顿操作,这个项目,就下载好了,全程大概也就几分钟。

之所以是几分钟,还是因为,这是第一次。
而后续,只需要,十几秒。
这时候,其实你还可以做一个事,就是,把前面的那些为了下载视频而做的一些事情和经验,直接跟AI说:
把这些经验,都更新到video-downloader这个skill里,下次就别这么慢了。
然后,它就会自己对他的Skill文件进行修改,下次,这些事情,就不用干了,随开随下,快到起飞。

这就是我的自己纯为了自己方便的一个skill全流程:
根据一个需求,用AI搜索github上得开源项目,把开源项目使用AI进行Skill化,首次运行后,寻找BUG和问题,重新迭代Skill,至此,Skill固化,形成我的主Agent中一个可靠的技能。
不止是一个下载视频的需求。
还可以是,把一个web项目,打包成一个轻量级的桌面APP。

于是,找到了Pake。

Github上一个45k的超棒的项目,那就,直接Skill化,以后,你的网页开发完,直接就可以用Pake skill,一句话变成桌面APP。
你还可以,直接做一个究极万能的格式转化工厂。

直接把这些最牛逼的格式转化项目,直接封装在一起,做成一个万能的格式转化Skill。
从此,你无需各种奇怪的格式转化器,一个skill,解决所有。
你还可以,把ArchiveBox转成Skill,从此,你有想保存下来的网页,都可以发送给ArchiveBox Skill来以无数种你想要的格式,帮你保存下来。

支持N种格式,真的。

甚至,你可以把著名的Ciphey,转成一个Skill。
从此,你就可以,在你的本地,配合Agent,直接破译密码。。。

这些,全部都可以Skill化,全部都可以加入到你的Agent之中,成为,你最坚实的技能,成为,你最恐怖的弹药库。
而我提到的这些,仅仅只是Github上开源项目的冰山一角。
Github上牛逼的开源项目,那些人类的经验、人类的光芒。
本就灿烂如星海。
因为Skills的诞生,因为Agent的强大,现在,每个人、每个普通人,你的背后,都是全人类过去数十年的积累,只要你想,他就可以为你所用。
你无需三头六臂,你无需头上长角,你已经拥有了海量的知识和技能。
如果回到3年前的你的面前,你觉得,他跟你如今可以做到的事、如今的能力边界,还有任何可比性吗?
朋友,这样璀璨、这样伟大、这样能让你成为超人的时代。
真的不会让你兴奋吗?
文章来自于“数字生命卡兹克”,作者 “卡兹克”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0