提示词工程不再玄学!
LLM 喜欢赞美,如果你在提示词中夸奖它是个「才华横溢的专家(genius expert)」,它就更可能为你生成更好的答案。
当然,OpenAI 的这位前研究科学家 William H. Guss 分享的这个技巧并不是新闻,之前就有不少研究者发现 AI 喜欢鼓励和赞美。
刚不久前,Huss 宣布发布了一款自称是「提示词工程的未来」工具 ell。具体来说,ell 是一款轻量级的函数式语言模型编程软件库,其优势包括自动化的版本控制和跟踪、丰富的本地开源视觉化工具、原生支持多模态数据。
项目地址:https://github.com/MadcowD/ell
该项目发布后反响热烈,网友们纷纷点赞。比如有一位网友表示一直在期待这样的工具,这将成为他构建 AI 软件栈的一个基础部分。
该项目上线一周时间就收获了 2600 多 star。
ell 是一个轻量级的函数式提示词工程框架,其设计思路基于以下几项核心原则。
提示词是程序,而不只是字符串
提示词不只是字符串,也是发送给语言模型的代码。ell 的一个设计思路是将语言模型看作是名为「语言模型程序(LMP)」的离散子程序。
提示词实际上是 AI 模型的一种参数
这个观点并不新鲜,比如谷歌研究者 Heiko Hotz 就表示过一样的想法,参阅文章《还在人工炼丹?自动提示工程指南来了,还带从头实现》。
Huss 表示,提示词工程的执行过程涉及到多次迭代,这就类似于机器学习中的优化过程。由于这里将 LMP 视为函数,因此 ell 可为该过程提供丰富的工具。
ell 支持对提示词进行自动版本控制和序列化,这需要用到动态和静态分析以及 gpt-4o-mini 自动生成的 commit 消息。这个过程类似于机器学习训练流程中的检查点管理。但它无需任何特定的 IDE 或编辑器 —— 全都可通过常规的 Python 代码实现。
用于监控、版本控制和可视化的工具
一开始的时候,提示词工程看起来就像是一种玄学。但其实只要有合适的工具,玄学也能变成科学。
Ell Studio 是一种支持提示词版本控制、监控和可视化的本地开源工具。使用此工具,提示词优化的过程可以变得有迹可循,在有必要时也能很好地回溯到之前的版本。
关注多模态
我们关心的数据通常不止文本,还包括图像、音频、视频等,但使用 LLM 处理这些数据往往会更麻烦。Huss 希望在使用 LLM 时,我们能像使用文本一样轻松地使用多模态数据。
这也融合进了 ell 的设计理念。ell 支持多种形式的多模态输入和输出。
提示词工程师宝玉对这个项目给出了很好的总结:
如果你也正需要一个这样的提示词工程工具,那就赶紧:
pip install ell-ai
文章来自于“机器之心”,作者“Panda”。