# 热门搜索 #
搜索
加入AI公司三个月,我都做了些什么?——与大模型对齐的人类工程师
5637点击    2024-03-22 11:19

本文主要内容为提示词工程师的工作实际经验和感悟。


详人所略,略人所详。


Prompt领域的优秀教程越来越多,基础知识可以参见社区先辈刘海同学:[23.08] 网上疯传的「AI 提示词工程师」到底是什么?


(这篇写得实在是好,我想不出任何不推荐的理由,提示词工程师必读好吧!刘海先辈受我一拜!)


大量的使用技巧,案例在LangGPT社区里也数不胜数,此处不赘。以下为正文


问:加入AI大模型公司三个月,你都做了些什么?


答:我在反复与大模型对齐......


问:最大的感触是什么?


答:抽象。


与大模型对齐的人类工程师


作为Prompt工程师就职,已经有三个月了,我的主要工作内容如下


售前技术支持


大模型公司还是要接单子的嘛,我在的公司目前还是一家创业公司,人员有限,每个人都得当多面手。


销售出去见客户的时候,很多技术问题细节回答不了,这个时候就由我出场了。勉强算是个技术人员,这几个月跟着销售面见了大量的客户,去了很多业务现场,积累的不少实际的业务经验,本身对你写prompt也是有帮助的,你只有知道了客户是在什么样的场景下去用你的大模型,现场是解决什么问题,你才能更好的去调整prompt,Know why才能Know how。


现在都是业务强导向,售前的这个活我也挺乐意干的,和客户现场交流的时候也需要捕捉他们的需求,另外也需要你为客户展示模型能力,现场根据客户的需求编写prompt,简单验证下场景。去帮助客户去梳理大模型的技术能够在他们的业务链条里怎么接入,解决什么问题,提升多少效率。有点AI落地解决方案的意思在。


emmm这几个月算是写了不少技术方案,锻炼了产品能力?


我还挺喜欢跟着销售大哥到处跑的。未来AI肯定会慢慢改造所有行业,现在能直接去行业一线,去了解早期AI时代大模型是怎么被打磨成一款产品打包应用出去的。这是非常宝贵的经验。


这部分工作我主要归结为售前技术支持,需要你懂一些技术原理。prompt工程师你不可能和算法、和研发去比代码能力,那么体现价值的地方就是你比研发懂业务,同时比销售和交付更懂自家大模型。


数据产出


上面讲到我会直面客户现场,和客户有很多沟通交流。交流最重点的一部分,就是得了解客户手上有什么样的数据,有多少量的数据,哪些数据是可以处理,然后拿去给大模型训练或者微调用的,哪些是价值不大的数据。


这会涉及到不少跨部门合作,你需要和算法同学商定这批数据怎么处理,标注哪些内容;决定好怎么处理数据后,就得开始布置上数据挖掘方案,和标注的同学一起确保数据产出的质量。因为有时候数据是海量的,我们又缺人,所以我也经常和标注同学一起去处理数据+质检......


有多少智能就有多少人工,虽然大模型本身已经预训练完成了,但是根据特定场景或者行业垂直场景需求,依然有大量数据需要人工去处理。作为prompt工程师,也得清楚微调的全部流程,微调前期最重要的工作就是数据的处理,你知道这个特定任务的数据是哪些,你才能更好的去调试prompt,去找prompt的编写技巧。


Prompt设计


有了以上两个环节后,其实才进入到具体的Prompt设计环节,这个时候你已经比较清楚业务需求+数据样本了,那么你以为prompt就很好编写了吗?


错!大错特错!


我知道现在有大量优秀的prompt框架,社区里很多大佬极其牛逼的提示词,用在ChatGPT4.0里,效果华丽,近乎炫技般。


但是国产大模型和ChatGPT真的不是一个东西,而且会极大的受限于客观条件。


很多技巧、框架、COT等等,在国产大模型上效果不佳。我这边,现实就是一轮对话,低消耗token,快速解决具象问题,把业务链打通,拿下订单,才有可能继续获得投资人的青睐,公司才能继续活下去。


我想,可能因为不少国内自研的大模型,是不是因为时日太短还是国内大模型RLHF做得不太好,与人类语义对齐这个效果很差。


我也用过千帆、百川的开发者平台,在那个上面调过大量prompt,到最后,完完全全变成了我与ai语义对齐,根本就不是ai和人类对齐......当你的一个提示词调试了近百个版本,最后发现,是那个语义最不通顺,看起来最稀奇古怪、莫名其妙的prompt效果最好的时候,内心有多么崩溃么!


这个过程你会见到大量模型幻觉和抽疯的回答,用一个词来形容,那就是“抽象”,真的太抽象了。


太棒了,我逐渐理解一切。



岗位要求和考核标准


详情参见刘海[23.08] 网上疯传的「AI 提示词工程师」到底是什么?中对BOSS上大量提示词工程师的JD分析。


真要我说的话,每家公司的业务不同,标准不同,其实没有什么硬性的考核标准,准确度这个东西是由人根据实际业务制定的。


这是个经验活,是个技巧活,得大量试错,大量测试,最后总结出一些规律。然后再实践,再总结。


最后突然有一天,模型部的同学告诉你咱家模型升级啦!快去测测!然后你惊奇的发现,那些规律有50%又失效了。


对想进来这个岗位的人提出个人意见


尽早在AI工具上实现一万小时的积累,天天玩、天天耍,什么千帆、百川、minmax各家开发者平台都去用用,就当是竞品分析了。


这波大模型是生成式AI,不是过去的判别式AI,这是有本质区别的,业务上接触到的很多人还在用过去的单个小模型算法去看待这波AI技术,这个肯定是比较片面的。


你要去锤炼自己的语言逻辑(逻辑清晰才能表述清楚任务),增加自己的世界知识(各行各业)和大模型知识,最后,扎根业务,多去一线跑。有项目才有未来。


希望社区未来做成什么样?


LangGPT社区是我见过的最棒的开源提示词社区!一直很感谢云中江树、盘盘、梁思姐、杜昕等大佬对我的支持和鼓励!


在提示词这方面,我觉得已经做的非常好了,唯一缺点就是更新的很慢,最近只有活动......咱也理解,毕竟江树好像去当小桔子了,肯定天天加班!(过去俺也是桔厂一员)


在成为提示词工程师前的知识点已经非常充足,好,那么成为提示词工程师之后呢?打怪升级的路径是什么,有哪些技能点需要点,转职当什么职业,这方面的东西很少。


目前看到比较多的职业规划路径是AI产品,但是网上和AI产品经理相关的优质社区好少啊!或者说有什么别的转职路径吗?


嗯,所以希望社区增加,成为Prompt工程师以后的晋级规划模块!


当然实际的工作经验分享也是越多越好!


总结


2023年是AI元年,2023年以前是信息时代,2023年以后是智能时代,我很庆幸自己在加入了一家诞生于AI元年的大模型公司。


随着我和数据接触的越来越多,我感觉到中国一个非常明显的优势是应用场景多,数据多。有些场景是可以形成数据飞轮的。在行业先发,会有很大优势。


未来大模型一定会无处不在,你有多大见解,就有多大价值,谁拥有议题,谁就拥有未来。


本文来源于公众号 wanwan的奇妙笔记,作者万玉大老虎





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0