一、第一本AI校稿的书
我的新书《云计算行业进阶指南》已经出版,本书使用了大模型进行AI校对书稿。
在本文稿发布前,我问了好几个AI,AI都说“还没有出版书籍宣称自己使用了AI校稿”,因此我可以说:
我AI校稿的工作在2023年就完成了,这篇文章也早就写好了,但必须等书籍正式出版,我才能向各位做分享介绍。
我的用词很严谨,因为是出版社给我提出使用AI校稿的工作建议,我估计有很多编辑已经在使用AI校稿了,所以说这是第一本“作者公开使用AI校稿”的书籍。
二、AI协作后,我证明人依旧有价值
我很讨厌某些人只知道跟AI表演贫嘴胡扯,然后就一惊一乍地宣传AI会取代人类的工作。这些肤浅的人日常就是“职场投机者”,他们看到AI可以比他们更滑、更快、更无底限地说“车轱辘套话”、“快速生成报告总结”,他们以为自己的各种扯淡、抢功和甩锅行为,就是人类的工作价值。而他们孱弱的思考能力根本守不住AI的攻击,AI确实会让这些肤浅的人失业。
在我使用AI校稿之前,我就尊重自己的同事和供应商。我会思考如何向协作方解释真实需求,我会评估协作方的能力极限,我验证协作方的工作结果,最终我本人承担总结和判断的责任。就算AI的智商超越了自然人,我过去和自然人怎么协作分工,现在就能和AI如何分工协作。
在我使用AI校稿之后,我更验证了自己的观点:
三、我为什么需要AI校稿
我找AI校稿并不是让AI替我写稿,而是替我校对修改书稿中过于口语化的部分,并给出书面化的修改建议。
我写好、提交给编辑的只是书籍的原稿,出版社会对原稿进行书面化、符合出版口吻的校对修改。编辑和作者不可能面对面核对原稿,而是每周通过一两万字的文档沟通。编辑堆积修改的内容越多,越容易误解作者原稿的意思,进而导致二次三次修改。
为了减少自己提交原稿的错误概率,我使用大模型帮我校对稿件。在保留作者原意、兼顾书面语规范的前提下,我每次给AI提交几百字的稿件,AI可以立刻反馈给我校准后的内容,这比我和编辑每周沟通一次、每次沟通上万字的效率高得多。
博文视点的总编张春雨表示:“相比作者手写的原稿,AI校对过的稿件能减少编辑们50%的校对工作量”。他的评价,实现了我用AI校稿的工作目的。
我随机选择了书稿中的四段文字,说明口语化原文和AI校稿后的区别:
这是我手写书稿中的四条原始文稿:
1. ARM处理器相对X86处理器的特点是“便宜高效但专用”。
2. 因为裸金属产品……,所以裸金属产品……。
3. 根据……,网络应用防火墙(简称WAF)属于……。
4. PaaS云产品一般不会向中小客户披露群集的性能和承载能力。
这是AI校稿后输出的文稿:
1. ARM处理器相对于X86处理器的特性可以概括为“成本较低但适用范围窄”。
2. 由于裸金属产品……,因此裸金属产品……。
3, 参照……,Web应用防火墙属于……。
4. PaaS云产品通常不会向中小客户公开集群的性能和承载能力。
这些对话式AI服务都是在线服务,其文字校正结果会有动态的变化,我在今年3月份特地将对话输出过程做了几份截图留念,但这些截图的篇幅过长,放在本文的结尾处了。
四、粗放校稿变成了儿戏
最初,我听出版社给了个“用AI校对稿件”的粗糙建议,我就随便找了一些AI碰运气,让第一次AI校稿的工作变成了儿戏。
我当时没给AI做角色定义,也没给出合适的提示词,只是跟AI吼了一嗓子“我要改个书稿,你帮我看看”,然后就发给AI两千字的书稿。
这种粗放校稿的结果,就是我无法评估和验收协作者的工作成果。因为笼统来看,我找不出AI修改了哪些内容,但我仔细核对又发现AI确实修改了1%的内容,而且修改的方向还不一定是对的。这就导致我要逐字细看AI的回复,眼睛都快累花了,简直就是在玩文字游戏“找不同”。
有人会提醒我,可以让AI帮我给两段基本雷同的文字找差异。兄弟们,相信我,这些方法我都试过,工作量只会更大……只要我还需要承担总结和判断的责任,AI给出答案我都要做结果校验。
五、摆正心态和AI合作
经过上述碰壁,我开始自我反思:我找一个新入职同事帮忙干活,也得说明工作目标和现有环境状态。如果我想让AI把活干好,那就要给AI预设好角色,告诉AI我具体要改什么内容,给AI提供明确的提示词。
为了让AI进入图书编辑的角色,让书稿改到符合出版规范,我和出版社编辑们多次沟通后,终于写出了下列很合理的提示词,并将这一长串儿提示词应用到和大模型的对话之中:
假设你是在一个出版社的图书编辑,对一篇云计算相关的书稿进行内容编辑加工,现在需要你修正我的稿件,直至符合中国出版行业的文字规范要求。
该稿件需要参照下列标准进行加工:
1. 遵守简体中文语法规则,修改书稿中存在的语病,使词语的搭配准确、得当。
2. 遵守现代汉语要求,修改书稿中的错别字和拼写错误,修改标点符号的使用错误。
3. 遵守中国出版图书的语法规则,避免口语化表达,尽量使用更正式、更优雅的书面表达,但是不能改变文稿原有的叙述目的。
4. 提交的稿件内容属于一本云计算书籍的“(本部分仅为举例,会经常更换内容:序言/云磁盘超卖复用/VPC产品功能/裸金属产品优势)”部分的章节,根据需要修改的内容所在的云计算和IT技术专业领域,准确地使用相关技术和服务术语,并保证术语的一致性。
5. 如果待编辑的书稿不存在上述4个方面的问题,请不要对书稿做修改,保留原文内容。
6. 我后续所有的沟通都是书稿内容,请你将修改完成后的文稿,直接回复到此文本框。
如果你明白我的意思,请回复“明白”,并保持静默。
通过提供这些提示词,我每次会向AI提交几百字,AI会立刻回复校验完毕的内容。我并不是盲目使用AI校稿的返回内容,而是对比原稿和AI修改稿件后,采信了AI校稿大约70%的内容,这个繁忙的过程持续了一个月。我将AI校对过的书稿发给出版社以后,编辑感觉到书稿质量有明显的提升。
除了文稿以外,我还使用AI生成很多炫酷的抽象配图。用户与其费力琢磨这些抽象图的提示词,还不如随便说一下自己的感想,让AI生成几十张图片,然后自己选感觉最好的配图。但本书中的精确表格我没使用AI生成,因为向AI解释我要怎么绘制表格,还不如自己用办公软件截图。就此来看,我们和AI的协作过程,很像老板和平面设计师的沟通过程。
六、AI校对后仍然是我的稿子
在经过AI校稿以后,自然就会引来一个新问题,这稿子到底还是不是我的,会不会有版权问题?我并不是法律专家,但我也为此做了一些准备。
结束语
用AI校稿是一次奇妙的经历,在实际应用AI以后,我很有信心得到这个结论:
附录-大模型实操截图
因为该大模型是一个在线业务,读者们做同样的尝试,可能会出现不同的结果。我在2023年10月完成的AI校稿工作,我在2024年3月,又将本文中提及的四处修改样例,在同样的大模型上实验了一次:
这些测试截图太长了,加在前文不易阅读,所以都摆放在文末了:
首先简单回顾我用AI对文稿修改的样例总结:
四条原始文稿:
1. ARM处理器相对X86处理器的特点是“便宜高效但专用”。
2. 因为裸金属产品……,所以裸金属产品……。
3. 根据……,网络应用防火墙(简称WAF)属于……。
4. PaaS云产品一般不会向中小客户披露群集的性能和承载能力。
大模型AI校稿后输出的文本:
1. ARM处理器相对于X86处理器的特性可以概括为“成本较低但适用范围窄”。
2. 由于裸金属产品……,因此裸金属产品……。
3. 参照……,Web应用防火墙属于……。
4. PaaS云产品通常不会向中小客户公开集群的性能和承载能力。
当我重复了和本文相同的提示词以后,第一、第二、第四次实验结果和我当初校稿的结果基本相同,第三次实验结果发生了很有趣的变异。AI大模型都是越变越聪明的,相信大家在试用时,会发现更大的模型进步。
第一个例句实测截图见下文:
第二个例句实测截图见下文:
第三个例句实测截图见下文:
第四个例句实测截图见下文:
本文来自微信公众号:云算计(ID:gh_0068c4e23a81),作者:曹亚孟