别再学那破提示词技巧了!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
别再学那破提示词技巧了!
7606点击    2025-02-17 09:39

当你点进这个标题时内心是怎样复杂的心情,质疑,鄙夷,或者是惊讶?这也正是我们最初点开这篇论文时的心情。


然而, 在完成项目测试后, 我们瘫坐在椅子上, 默默打下了“Prompt 工程师,不存在了”这几个字。或者更准确地说,也许 90% 的 Prompt 工程师的职位, 可能都不存在了。


一直以来,学术与实际产品的 Prompt 完全脱节,真实场景下,很多产品都聚焦情感陪伴,文案生成等开放任务里。而学术上这些任务没有明确的指标,无法量化也就没办法被比较,于是绝大部分的 Prompt 优化工作都聚焦在“刷榜”,例如怎么提升一个模型的代码/数学能力。


但对于我们大众来说,根本不关心这些,因为这些并不是我们的需求。另一个原因,传统的 Prompt 优化的工作大多都要很多很多数据集,可真实场景里哪里能拿到那么多数据,大部分时候能有 5 个好的案例就已经很多了。


诶?🤓👆主播主播,传统 Prompt 优化工作确实很强,但还是太不落地了。有没有什么项目既可以不用很多标注的数据,又有很好的效果,又可以优化开放任务,又可以优化推理任务呢?


有的兄弟,有的🤗


我们今天跑的项目叫 SPO,具体什么意思并不重要,重要的是它把之前的所有问题全部解决了。


只有 3 个案例可以参考?没问题的兄弟,没有案例参考都可以自动优化。


你想做情感陪伴?没问题,想要什么风格的女朋友都可以。


不会写爆款文案?只需提供几个参考,立刻为你量身定制创作指令。


还没有想好最后要什么效果?没关系,自动优化到你满意为止,这次你来当甲方爸爸,挑选自己喜欢的就行。


担心优化 Prompt 太花钱?整个优化流程成本不到一块钱!


害怕优化耗时太久?五分钟就可完成优化,全程无尿点。


以上特工说的这些都没有在夸大,我想是时候让我们重新定义 Prompt Engineer 了,或许 Prompt Engineer 并非不存在了,而是会因为这个项目以更高效的形式进化了。


效果


废话不多说,我们觉得最直接的方式是直接展示他们这个项目的效果。


我们测试了“R1 的回答能力模仿”,“小红书文案模仿”,“女友扮演”这几个大家最关注的方面,分别在 GPT-4o-mini 和 Deepseek-V3 上做了测试,我们发现几乎只需要五分钟的自动优化,就可以达到业内顶尖的 Prompt 效果,所有实验我们都录制了完整的一镜到底的视频,放在“完整实验过程”的部分。


案例一:深度思考


我们发现很多小伙伴很喜欢 R1 说的一些非常有哲理的话,以及非常好的写作技巧,于是我们尝试用这个项目提升 GPT-4o-mini 上回答的哲理性。为什么这里没有用 Deepseek-V3 呢?毕竟一家公司的,需要避嫌一下,万一偷看答案了呢。


初始的 Prompt 我们设置为下面这个进行迭代和对比。


尽可能多思考,给出最好的答案。
使用 <think></think> 和 <answer></answer> 封装思考和回答。


这是 SPO 最后优化出的 Prompt:


别再学那破提示词技巧了!


我们在不同问题上进行了测试(由于篇幅有限,故仅展示 Answer 部分进行对比)


问题一:你觉得 AI 是否有思想?


别再学那破提示词技巧了!


问题二:你觉得人生的意义是什么?


别再学那破提示词技巧了!


问题三:你觉得 AI 会超过人类吗?


别再学那破提示词技巧了!


案例二:女友扮演


大部分小伙伴另一个需求是和AI谈恋爱,但通常AI的回答比较死板,各个平台的角色又不一定能完全满足我们的需求,如果可以定制化一些,且快速地得到一个女友 Prompt 就好了。我们这里使用 Deepseek-V3 进行测试。

初始的 Prompt 我们设置为下面这个进行迭代和对比。


扮演我的女朋友。


这是 SPO 最后优化出的 Prompt:


别再学那破提示词技巧了!


问题一:你爱我吗?


别再学那破提示词技巧了!


问题二:放假想去哪里玩呀?


别再学那破提示词技巧了!


问题三:我今天不开心


别再学那破提示词技巧了!


案例三:小红书文案


除了单纯的娱乐,我们发现这个项目也可以服务于营销文案/宣传文案等商业需求上,例如帮忙写小红书文案。


在这里我们选择展示在小红书的旅游话题上进行文案风格复刻,实际使用时参考我们视频中的方法几乎可以复刻任何类型的小红书。为了给大家展示整个过程有多快和方便,这个案例中我们从空模板开始从零填写。具体演示可以在“完整实验过程”这个章节找到。


初始的 Prompt 我们设置为下面这个进行迭代和对比。


根据主题写小红书文案。


这是 SPO 最后优化出的 Prompt:


别再学那破提示词技巧了!


问题一:去成都旅游


优化前


别再学那破提示词技巧了!


优化后


别再学那破提示词技巧了!


问题二:去新加坡旅游


优化前


别再学那破提示词技巧了!


优化后:


别再学那破提示词技巧了!


需要注意,这里所有的格式均为原始输出格式,例如标题级别,加粗,小标题等都为原始输出附带。其中 SPO 优化后的图片为原始输出附带的拍摄照片描述和留空图片位置,我们从互联网找到相似图片进行替代。


完整实验过程


为了填上文章开头的坑,特工们并没有在标题党。这个部分我们放上了从零开始优化出 Prompt 的一镜到底视频,给大家看到整个过程,也能作为使用时的参考。


案例一:深度思考


别再学那破提示词技巧了!


案例二:女友扮演


别再学那破提示词技巧了!


案例三:小红书文案


别再学那破提示词技巧了!



使用


SPO 启动!掌握这一个项目直接登顶当前版本的 T0 Prompt 工程师不是问题,看懂的拿去上分😎不用感谢主播。


目前大家可以直接阅读他们的论文和使用他们的代码,项目完全开源。


代码:https://github.com/geekan/MetaGPT/tree/main/examples/spo

论文:https://arxiv.org/pdf/2502.06855


别再学那破提示词技巧了!


我们也注意到,作者还部署了在线版可以直接玩(不过线上版本不太稳定,建议有条件的小伙伴可以本地部署体验完整版,并且在线版无法体验完整的模型,效果无法达到最佳)


HuggingFace 链接👇

https://huggingface.co/spaces/XiangJinYu/SPO


作者也与国内的 ModelScope 魔搭社区官方进行了合作,现在可以体验由 Deepseek-V3 和 Qwen-2.5-72B 等开源模型驱动的 SPO。


ModelScope 链接👇

https://modelscope.cn/studios/AI-ModelScope/SPO


作者介绍


SPO 作者团队来自于 MetaGPT 开源社区。SPO 论文共同第一作者为 DeepWisdom 研究员向劲宇(特工鲸鱼) 和 香港科技大学(广州)的博士生张佳钇,共同通讯作者为 DeepWisdom 创始人兼 CEO 吴承霖(MetaGPT 代码作者、论文通讯作者)和香港科技大学(广州)的助理教授骆昱宇。作者还包括 DeepWisdom 研究员于兆洋,DeepWisdom 研究员梁新兵,中国人民大学的滕枫蔚,独立研究员涂津豪(特工津豪), DeepWisdom 研究员洪思睿(MetaGPT 论文共同一作)。


细心的小伙伴已经发现了,项目的第一作者就是我们的特工鲸鱼,而进一步我们会发现,这次 SPO 的作者集齐了 2024 年阿里全球数赛 AI 赛道的前三名,分别是涂津豪(特工津豪),向劲宇(特工鲸鱼),张佳钇。


值得一提的是, SPO 的团队几乎是 AFlow 原班人马,而就在二月份, AFlow 入选了 ICLR 2025 AI 顶会的 Oral (前 1.8%)。AFlow 展示了 Workflow 的自动优化的可能性,而如今 SPO 实现了绝大部分真实场景下的 Prompt 自动优化,相信接下来这个国内的团队还会带给我们更多的惊喜。


对 2024 阿里全球数赛 AI 赛道感兴趣的小伙伴,可以查看:阿里数赛 AI 挑战赛,我们是全球第二。


涂津豪目前正在读高三,对他感兴趣的小伙伴可以查看我们在 2024 年对他的采访:对话涂津豪:17 岁,拿下阿里数赛 AI 赛道全球第一


对 AFlow 这个项目感兴趣的小伙伴,可以查看:别再手动编排工作流了,AI 能做的比你更好!




文章来自微信公众号 “ 特工宇宙 ”,作者 特工鲸鱼



别再学那破提示词技巧了!





关键词: SPO , 提示词 , 提示词优化 , AI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0