鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

11711点击 2024-05-25 18:41

鹅厂搞了个150多人的“翻译公司”，从老板到员工都是AI智能体！

主营业务是翻译网络小说，质量极高，参与评价的读者认为比真人翻译得还要好。

而且相比于雇佣真人，用它来翻译文学作品，成本降低了近80倍。

公司名为TransAgents，每个岗位都配备了30个不同的职工，能够根据语言、体裁和目标受众适配不同的翻译风格。

相比于传统的翻译，产出的译文更加灵活多样，也更符合目标语言的表达习惯，文学性也更强。

所以，TransAgents虽然在以相似度为基础的自动评估中“失败”，却赢得了读者和专业人士的大力肯定。

这样的表现甚至让人感叹说，或许人类对人工智能生成的内容更加青睐的时代，就要来了。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

还有人表示，TransAgents是证明自己错看了人工智能的又一证据——本以为由于模型限制，小说的翻译对AI会极其困难，结果AI智能体把这个任务完成得非常好。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

所以，TransAgents到底有没有那么神呢？

真人和GPT-4都说好

为了评估TransAgents的翻译质量，作者选择了WMT2023数据集，需要对其进行篇章级的文学翻译。

该数据集从12部网络小说中各截取了20个连续的章节，涉及如下八种类型：

游戏类（Video Games，VG）

东方玄幻类（Eastern Fantasy，EF）

科幻爱情类（Sci-fi Romance，SR）

当代爱情类（Contemporary Romance，CR）

玄幻类（Fantasy，F）

科幻类（Science Fiction，SF）

恐怖惊悚类（Horror & Thriller，HT）

玄幻爱情类（Fantasy Romance，FR）

起初，作者使用d-BLEU进行了自动评估，该方法会与参考样本进行相似度计算，相似度越高得分也就越高。

具体到本项目当中，参考样本一共有两组，样本一是人工给出的翻译结果，样本二是对网络中的双语文本进行对齐后得到。

结果，TransAgents的得分并不理想，只有25分，连SOTA的一半都不到。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

但这并不意味着TransAgents的翻译质量不行，而是因为用相似度来衡量文学作品翻译的表现，本身就有失偏颇。

文学翻译不是逐字对照，而是需要在语义、语气、风格等方面进行创造性的转换，这些转换可能导致译文与参考译文在表面上差异较大，相似度不高自然就不意外了。

所以，作者干脆直接让真人（至少10人）来评价翻译的质量，顺便也让GPT-4（0125-Preview）来看了看，在TransAgents、GPT-4（1106-Preview）和真人当中，谁的翻译最好。

测评者会看到针对同一段原文的不同翻译，其中真人只看译文，GPT-4则是原文译文都看。

结果，真人测评者有超过一半都认为TransAgents比人类翻译得更好，8.4%认为两者质量相当，GPT-4也认为TransAgents比自己（和人类）的翻译质量高。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

除了这些大众评审之外，两名专业的翻译也认为，虽然人工翻译更加忠实于原文，但TransAgents给出的翻译明显更有文学色彩，更加简洁、在遣词用句上体现出了语言天赋和深厚的文学表现力。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

MATTR和MTLD测试指标也证明了这一点，尤其是在MTLD上，TransAgents的语言多样性比真人和GPT-4高出了三分之一左右。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

在作者展示的案例中，TransAgents会根据目标语言的习惯对翻译内容做出调整，真人（Ref1）和GPT-4虽然翻的也没错，但相比之下不如TransAgents符合语言习惯。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

另外在前后一致性上，TransAgents也超过了单纯使用GPT-4，对相同的原文保持使用一样的译文。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

当然，也不是说所有类型它都擅长，在前面提到的8种类型中，TransAgents在游戏、科幻爱情等类型上的表现突出，而在恐怖惊悚等类型上就比较平庸了。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

△图中虚线代表50%Win rate

同时作者也发现，TransAgents在翻译时并非“照单全收”，而是会出现一定程度的遗漏现象。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

不过从测试中未看过原文的读者给出的评分来看，这样的遗漏似乎没有影响到他们的阅读体验。

所以，这家“翻译公司”是如何运行的呢？

多智能体分工协作

在这个公司当中，不同的智能体分别扮演着CEO、初/高级编辑、真·翻译、本地化专家和校对（Proofreader）这些不同的职位，除CEO外每个职位各有30人，每个人擅长的领域也有所不同，另外还有一个Ghost Agent。

这些智能体由GPT-4-Turbo驱动，每个角色都包含姓名、年龄、职位、工作年限及掌握的语言等多维度的设定。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

接到“客户”的翻译要求后，CEO会综合分析原文和目标语言、体裁、目标受众等信息，从几位高级编辑中选择擅长领域最匹配的一位。

此时，Ghost Agent会对CEO的选择进行评估，告知其人选是否合适，从而减少选择失当的现象。

被选定的高级编辑会与CEO合作，再次结合任务需求和个人特点，从公司人才库中进一步选择初级编辑、翻译、本地化专家和校对等团队成员。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

团队组建好后，首先由初级编辑逐章节识别所有潜在的关键术语，生成初始术语表，交由高级编辑审查，删除其中的通用术语，生成修订后的术语表，反复迭代直到不需要进一步修改。

然后，结合术语在不同语境下的意义，高级编辑会将术语表中的关键术语翻译为目标语言。

有了术语表后，初级编辑会为每一章生成详细的章节摘要，尽可能保留关键信息和细节，然后还是让高级编辑来审查，并删除冗余或不必要的信息，让章节摘要更加简明扼要。

接着，高级编辑根据修订后的章节摘要编写全书的摘要，概括主要情节、人物和主题，并随机选择书中的一章，分析其语气、风格和目标受众，制定翻译风格指南。

翻译风格指南会发送给项目团队所有成员，以确保译文风格的一致性。

根据风格指南，公司中的真·译员会逐章节进行初步翻译，把初稿交给初级编辑审查，检查是否遵循翻译风格指南，并提出改进意见。

在此基础之上，高级编辑会评估经过修改的译文质量，决定是否需要进一步修改，译员、初级编辑和高级编辑反复迭代，直到译文质量满足要求。

但此时得到的翻译文本并不是终稿，还要交给本地化专家进行调整。专家会识别可能需要文化调适的内容，如习语、隐喻等等，并对这些内容进行调整，使其在保留原文意图的基础之上更贴近目标语言和文化。

调整后的文本会让初级编辑和高级编辑再次审查，确保译文在文化适应性和忠实度之间取得平衡。

这之后，还有校对人员再次检查语法、拼写、标点和格式错误，如果有修改，还要再让编辑进一步审核。

这些流程都走完后，高级编辑会进行最后的终审，重点关注相邻章节之间的连贯性，确保情节、人物、主题等元素在全书范围内保持一致，一旦发现问题则发回给前面的团队成员进行修改，直到形成最终的译本。

如果客户对译本有修改意见，则会再次由高级编辑牵头，组织相关人员进行修改，直到定稿。

不仅是在工作流程上极其严格规范，在客户对译本满意后，高级编辑还会组织项目团队“开会”进行项目总结，分享经验教训。

过程中积累的有价值的术语、翻译技巧、文化调适策略等知识会被整理归纳，上传至公司的知识库，供后续项目参考。

One More Thing

TransAgents已经不是第一个由智能体组成的“公司”了，去年就有来自清华的“游戏公司”ChatDev爆红网络，背后所运用的核心技术就是多智能体。

如果把视线放宽，不只看“公司”，还有斯坦福的AI小镇、清华的AI狼人杀游戏，都在使用多智能体进行着真实人类社会的模拟。

总之随着大模型研究的深入，智能体和群体智能实验已成AI研究最热门方向之一，而且从这次的TransAgents来看，多智能体协同已经开始显现出了实际效益。

（顺便提一句，有网友发现，从斯坦福小镇到ChatDev，再到这次的TransAgents，多智能体研究的作者是真的喜欢《星露谷物语》式的绘画风格。）

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

当然，也有人对此表示了担忧，认为由AI来主导翻译，会导致语言的同质化，让各种语言中独特的表达消失。

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

更有甚者，已经跳出TransAgents本身，想到Ilya对大规模Agent合作的恐惧了……

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

那么你认为在群体智能这条路上还能创造出什么新奇的成果呢？欢迎在评论区晒出你的脑洞。

论文地址：

https://arxiv.org/abs/2405.11804

文章来源于：微信公众号量子位，作者：克雷西

鹅厂造了个AI翻译公司：专攻网络小说，自动适配语言风格，真人和GPT-4看了都说好

关键词: AI翻译 , AI , 腾讯AI , TransAgents , GPT-4

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI小镇

【开源免费】ai-town是MIT授权的一个AI虚拟小镇，该项目可以让研发人员轻松构建和定制你自己的AI小镇版本，其中居住在小镇的AI角色可以进行交流和社交。该项目受到研究论文《生成代理：人类行为的交互模拟》的启发。
项目地址：https://github.com/a16z-infra/ai-town

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT