加入AI公司三个月，我都做了些什么？——与大模型对齐的人类工程师

6290点击 2024-03-22 11:19

本文主要内容为提示词工程师的工作实际经验和感悟。

详人所略，略人所详。

Prompt领域的优秀教程越来越多，基础知识可以参见社区先辈刘海同学：[23.08] 网上疯传的「AI 提示词工程师」到底是什么？

（这篇写得实在是好，我想不出任何不推荐的理由，提示词工程师必读好吧！刘海先辈受我一拜！）

大量的使用技巧，案例在LangGPT社区里也数不胜数，此处不赘。以下为正文

问：加入AI大模型公司三个月，你都做了些什么？

答：我在反复与大模型对齐......

问：最大的感触是什么？

答：抽象。

与大模型对齐的人类工程师

作为Prompt工程师就职，已经有三个月了，我的主要工作内容如下

售前技术支持

大模型公司还是要接单子的嘛，我在的公司目前还是一家创业公司，人员有限，每个人都得当多面手。

销售出去见客户的时候，很多技术问题细节回答不了，这个时候就由我出场了。勉强算是个技术人员，这几个月跟着销售面见了大量的客户，去了很多业务现场，积累的不少实际的业务经验，本身对你写prompt也是有帮助的，你只有知道了客户是在什么样的场景下去用你的大模型，现场是解决什么问题，你才能更好的去调整prompt，Know why才能Know how。

现在都是业务强导向，售前的这个活我也挺乐意干的，和客户现场交流的时候也需要捕捉他们的需求，另外也需要你为客户展示模型能力，现场根据客户的需求编写prompt，简单验证下场景。去帮助客户去梳理大模型的技术能够在他们的业务链条里怎么接入，解决什么问题，提升多少效率。有点AI落地解决方案的意思在。

emmm这几个月算是写了不少技术方案，锻炼了产品能力？

我还挺喜欢跟着销售大哥到处跑的。未来AI肯定会慢慢改造所有行业，现在能直接去行业一线，去了解早期AI时代大模型是怎么被打磨成一款产品打包应用出去的。这是非常宝贵的经验。

这部分工作我主要归结为售前技术支持，需要你懂一些技术原理。prompt工程师你不可能和算法、和研发去比代码能力，那么体现价值的地方就是你比研发懂业务，同时比销售和交付更懂自家大模型。

数据产出

上面讲到我会直面客户现场，和客户有很多沟通交流。交流最重点的一部分，就是得了解客户手上有什么样的数据，有多少量的数据，哪些数据是可以处理，然后拿去给大模型训练或者微调用的，哪些是价值不大的数据。

这会涉及到不少跨部门合作，你需要和算法同学商定这批数据怎么处理，标注哪些内容；决定好怎么处理数据后，就得开始布置上数据挖掘方案，和标注的同学一起确保数据产出的质量。因为有时候数据是海量的，我们又缺人，所以我也经常和标注同学一起去处理数据+质检......

有多少智能就有多少人工，虽然大模型本身已经预训练完成了，但是根据特定场景或者行业垂直场景需求，依然有大量数据需要人工去处理。作为prompt工程师，也得清楚微调的全部流程，微调前期最重要的工作就是数据的处理，你知道这个特定任务的数据是哪些，你才能更好的去调试prompt，去找prompt的编写技巧。

Prompt设计

有了以上两个环节后，其实才进入到具体的Prompt设计环节，这个时候你已经比较清楚业务需求+数据样本了，那么你以为prompt就很好编写了吗？

错！大错特错！

我知道现在有大量优秀的prompt框架，社区里很多大佬极其牛逼的提示词，用在ChatGPT4.0里，效果华丽，近乎炫技般。

但是国产大模型和ChatGPT真的不是一个东西，而且会极大的受限于客观条件。

很多技巧、框架、COT等等，在国产大模型上效果不佳。我这边，现实就是一轮对话，低消耗token，快速解决具象问题，把业务链打通，拿下订单，才有可能继续获得投资人的青睐，公司才能继续活下去。

我想，可能因为不少国内自研的大模型，是不是因为时日太短还是国内大模型RLHF做得不太好，与人类语义对齐这个效果很差。

我也用过千帆、百川的开发者平台，在那个上面调过大量prompt，到最后，完完全全变成了我与ai语义对齐，根本就不是ai和人类对齐......当你的一个提示词调试了近百个版本，最后发现，是那个语义最不通顺，看起来最稀奇古怪、莫名其妙的prompt效果最好的时候，内心有多么崩溃么！

这个过程你会见到大量模型幻觉和抽疯的回答，用一个词来形容，那就是“抽象”，真的太抽象了。

太棒了，我逐渐理解一切。

加入AI公司三个月，我都做了些什么？——与大模型对齐的人类工程师

岗位要求和考核标准

详情参见刘海[23.08] 网上疯传的「AI 提示词工程师」到底是什么？中对BOSS上大量提示词工程师的JD分析。

真要我说的话，每家公司的业务不同，标准不同，其实没有什么硬性的考核标准，准确度这个东西是由人根据实际业务制定的。

这是个经验活，是个技巧活，得大量试错，大量测试，最后总结出一些规律。然后再实践，再总结。

最后突然有一天，模型部的同学告诉你咱家模型升级啦！快去测测！然后你惊奇的发现，那些规律有50%又失效了。

对想进来这个岗位的人提出个人意见

尽早在AI工具上实现一万小时的积累，天天玩、天天耍，什么千帆、百川、minmax各家开发者平台都去用用，就当是竞品分析了。

这波大模型是生成式AI，不是过去的判别式AI，这是有本质区别的，业务上接触到的很多人还在用过去的单个小模型算法去看待这波AI技术，这个肯定是比较片面的。

你要去锤炼自己的语言逻辑（逻辑清晰才能表述清楚任务），增加自己的世界知识（各行各业）和大模型知识，最后，扎根业务，多去一线跑。有项目才有未来。

希望社区未来做成什么样？

LangGPT社区是我见过的最棒的开源提示词社区！一直很感谢云中江树、盘盘、梁思姐、杜昕等大佬对我的支持和鼓励！

在提示词这方面，我觉得已经做的非常好了，唯一缺点就是更新的很慢，最近只有活动......咱也理解，毕竟江树好像去当小桔子了，肯定天天加班！（过去俺也是桔厂一员）

在成为提示词工程师前的知识点已经非常充足，好，那么成为提示词工程师之后呢？打怪升级的路径是什么，有哪些技能点需要点，转职当什么职业，这方面的东西很少。

目前看到比较多的职业规划路径是AI产品，但是网上和AI产品经理相关的优质社区好少啊！或者说有什么别的转职路径吗？

嗯，所以希望社区增加，成为Prompt工程师以后的晋级规划模块！

当然实际的工作经验分享也是越多越好！

总结

2023年是AI元年，2023年以前是信息时代，2023年以后是智能时代，我很庆幸自己在加入了一家诞生于AI元年的大模型公司。

随着我和数据接触的越来越多，我感觉到中国一个非常明显的优势是应用场景多，数据多。有些场景是可以形成数据飞轮的。在行业先发，会有很大优势。

未来大模型一定会无处不在，你有多大见解，就有多大价值，谁拥有议题，谁就拥有未来。

本文来源于公众号 wanwan的奇妙笔记，作者万玉大老虎

加入AI公司三个月，我都做了些什么？——与大模型对齐的人类工程师

关键词: 大模型 , Ai , AI公司 , 大模型对齐 , AI工程师

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0