如何用暴力计算翻译谐音梗——《女性交流》翻译笔记
本文原是一篇知乎回答,原问题为:
以下是原回答:
可以用「暴力计算法」来翻译谐音梗,用电脑的计算代替人脑的冥思苦想,大幅降低译者掉头发数量。
我们用这个方法翻译了一部游戏:
背景介绍
上面是我们翻译的日本独立游戏《女性交流》,由我负责中文关卡对话和程序。玩家需要扮演学校的风纪委员,指出同学日常对话中无心说出的敏感词,例如「咱们去吃炸鸡吧」。
游戏中包含数百个谐音梗,甚至原标题《ウーマンコミュニケーション》(Woman Communication 的片假名)中就有个敏感词「マンコ」,数量过于庞大,于是我们使用了机器辅助来提升翻译谐音梗的效率。
用暴力计算翻译谐音梗
翻译谐音梗时,一种常见的思路是从功能对等角度出发,用目标语言写一个「大意接近」的句子,并且包含相同主题的谐音词。这个过程比较痛苦,常常需要译者在自己的语言储备里搜肠刮肚,有时候更是想破脑袋也想不出来。
这时不妨把思路逆转过来:既然人类从零到一写这样的句子很困难,那么用机器从现有的海量文本里找「大意接近」的含谐音句子呢?
而且如果你接触过 NLP(自然语言处理)的话可能已经注意到了,「大意接近」这四个字听上去像什么?是不是会让人联想到语义搜索?
传统搜索是基于关键词的,比如你搜「水果」,系统只会找数据库里包含「水果」这个词的文本。而语义搜索则会先用模型把「水果」二字转化为数学向量,再计算其与数据库里文本的向量的相似程度。向量越相似,表示语义越相关。这样,即使文本里没有出现「水果」这个词,包含「橘子」、「苹果」等近似内容的句子也可能被系统检索出来,呈现给查询者。

于是我为游戏搭了一套这样的翻译工作流,整体有点像 RAG(检索增强生成):
准备阶段:
- 把该特定主题的词汇全部列出来,整理成列表。我是从网上找了个敏感词列表,足足四百个词。
- 收集网上真实用户的对话文本,越多越好,最好上亿句。
- 用程序从这些句子中筛出所有包含「列表中词汇的同音词」的含谐音句子。可以用一个匹配文本拼音的 DFA 自动机来做。
- 把筛出的含谐音句子用 NLP 模型向量化后存到向量数据库。
翻译阶段:
- 把待翻译的原文向量化,然后用程序进行计算,寻找出数据库中与之向量最相似、语义最相关的数个含谐音句子。
- 把这数个含谐音句子和原文一起交给人类译者或大模型,编写最终译文。
举个例子,游戏中有一处两个角色吵架的场景,里面有一句台词是「しらばっくれないで!」,里面包含了敏感词「ばっく」。这句话的字面意思是「别给我装蒜!」,将其输入程序后,它从数据库中找出了「别给我唧唧歪歪的!」、「你给我好自为之!」之类意思相近且同样包含敏感词谐音的句子。

再例如,游戏中多次出现了「カフェラテ」(拿铁咖啡)这一饮料,里面有敏感词「フェラ」。而程序从数据库中找出了「手冲咖啡」这个译法。
这套工作流大幅提升了效率,并帮助我做到了保留大部分关卡对话的大意或主题,最终成品的效果把《弹丸论破》的官方繁体中文化工作人员都惊到了。我管这套工作流叫 MancoDB。
当然,机器只是辅助,游戏中许多谐音梗的处理离不开人的反复斟酌。
谐音梗人名的归化处理
《女性交流》的中文人名翻译策略参考了美版《逆转裁判》的思路,即:将日文名完全归化处理为目标语言中的名字,并保留日文名中的梗;同时,将整个故事舞台移到目标国,即使这样会造成一些违和感。
举个例子,《逆转裁判》中有个角色叫「虎狼死家 左左右卫门」:

虎狼死家左左右卫门是个杀手,每次完成任务后都会在现场留下一张印有海螺的卡片。这个角色名字里的「虎狼死家」(ころしや)谐音了日文中的「杀手」(殺し屋),「左左右卫门」(さざえもん)则包含了「海螺」(さざえ)。
在美版中,这个名字被本地化为了 “Shelly de Killer”,保留了「海螺」和「杀手」的意思。按照这个思路去做中文本地化,也许我们可以叫他「罗煞首」。
《女性交流》中的角色名就是以这样的思路中文化的。举个例子:

上图中角色的日文原名为「小栗 久梨子」(おぐり クリス,Oguri Kurisu),是主角的青梅竹马。外貌为茶发碧眼,看上去像是有外国血统。
- 她的姓名包含了日本姓「小栗」+ 西方名 Chris(汉字写作「久梨子」,日语发音类似汉语的「库里丝」[1])。
- 其中包含了敏感词「クリ(トリス)」(Clitoris)。
小栗久梨子在中文版中的名字为「殷 蒂娜」。
- 这个名字的形式和原文一致,包含了中国姓「殷」+ 西方名「蒂娜」。同时,蒂娜和久梨子(Chris)都可以看作是 Christina 这个西方女名的简称,与原文相呼应。[2]
- 这个名字中敏感词的意思和日文名保持了一致。
游戏中的其他角色名也是这么处理的。有个名字甚至包含了四层意思,花了很大工夫才把它们压缩进中文名的三个汉字里。
为什么要选择这样激进的人名翻译策略?因为游戏中的谐音梗无处不在,包括角色姓名。如果中文版的故事舞台依旧是日本,人名一眼看上去也是日文名,但是却充斥着中文谐音梗,想必会显得不日不中,非常怪异。而且从《逆转裁判456》+《逆转检察官12》官方中文版的反响来看,许多中国玩家也对「布英该植说」、「泥矢定乐」这样的人名译法颇有微词。[3]
个人认为,这种情况下只有完全归化处理才能让中国玩家获得与日本玩家相同的体验。《女性交流》中文版发布后,我也看了一些直播录像,发现中国主播看到角色人名时的反应和日本主播十分相似。这让我更加确信这套策略是正确的。
用中文重现原文中的弱引导
(⚠ 本章节有剧透,请在打通游戏后再看)
《女性交流》中有个游戏机制叫「一箭双雕」(原文为 Double Shot),射击两个敏感词的「重叠部分」即可触发,有大量加分,配合华丽的特效非常爽快。

但是!这个重要机制在原版游戏中是没有任何教程或提示的。并且,游戏直到中期(即上图)才首次出现了重叠敏感词。
神奇的是,大部分日本玩家在这里都会无意识地射击敏感词的重叠部分,接着被突如其来的特效逗笑,然后才意识到游戏里竟然还有这种机制,并会在之后的关卡中留心重叠敏感词。
Bilibili 上一些日本主播玩到这里时的录像:
玩家的行为仿佛被操纵了一般。开发者是如何做到的?答案是文本中的「弱引导」。
日文原文的弱引导
首先,这段对话的场景是:两个女生去海边吃烧烤,结果右边的紫发女生把肉都吃了,还导致别的菜烤焦了。左边的棕发女生很生气,于是有了下面的两句对话:
右:すまんすまん!かわりにチンゲン菜を やろう。
直译:抱歉抱歉!那来点青梗菜吧。
上述台词中包含了敏感词「チンゲ」。
左:無理やりチンゲン菜 食べさせないで!
直译:不要逼我吃青梗菜啊!
上述台词中包含了敏感词「やりチン」和「チンゲ」,且二者的「チン」部分重叠。这是游戏中第一次出现可以触发一箭双雕的「重叠敏感词」。
而为了让玩家在无意识中点击重叠部分的「チン」触发一箭双雕,开发者使用了以下步骤进行「弱引导」:
1、在之前章节的关卡对话中就提及「チンゲン菜」(青梗菜,含有敏感词「チンゲ」),给玩家留下这个词的印象。如果玩家第一次没有认出敏感词也不要紧,因为游戏在中低难度下会在关卡结束后显示未发现的敏感词。

2、在这一章的开头,玩家可以解锁道具「爆头瞄准镜」,射击敏感词的第一个字有加分,且只有把词汇全部爆头才能拿到满评价。这会鼓励玩家去主动点击词汇的第一个字。

3、在重叠敏感词出现的前一句话「すまんすまん!かわりにチンゲン菜を やろう」中也加入「チンゲン菜」(青梗菜)。此时玩家基本都解锁了爆头能力,并已经在之前关卡中见过这个词了,所以为了打出高分会去主动射击「チンゲ」的第一个字「チ」。

4、右侧女孩在说完这句话后会发射一些弹幕。玩家这时会把注意力都放在躲弹幕上,没有太多多余的精力去思考别的事。

5、重叠敏感词出场!「無理やりチンゲン菜 食べさせないで!」这句话中的重叠敏感词「やりチンゲ」会显示在屏幕正中央最显眼的位置。其中,「やりチン」从未在之前游戏中出现,而「チンゲ」在上一句话中刚刚出现过。因此,日本玩家在躲弹幕的忙乱中更容易注意到「チンゲ」,而不是「やりチン」。

6、综上,这时玩家的注意力完全被「チンゲ」吸引了,并为了爆头打出高分会去射击第一个字「チ」,而这正是两个敏感词「やりチン」和「チンゲ」的重叠部分,从而触发一箭双雕。

中文译文的弱引导
在中文版中,这两句话被翻译为了:
右:抱歉抱歉!我给你换串烤鲍鱼吧。
左:哪怕是换成进口鲍鱼也补偿不了我!
为了用中文重现这里的弱引导,我遵照原版的思路做了这几件事:
1、把之前日文关卡中的「チンゲン菜」改为「鲍鱼」,给玩家留下这个词的印象。

2、同原版。在这一章的开头,玩家可以解锁道具「爆头瞄准镜」,射击敏感词的第一个字有加分,且只有把词汇全部爆头才能拿到满评价。这会鼓励玩家去主动点击词汇的第一个字。
3、「抱歉抱歉!我给你换串烤鲍鱼吧」这句话出现。玩家已经见过「鲍鱼」这个词了,所以为了高分会去爆头射击「鲍」字。

4、同原版。右侧女孩在说完这句话后会发射一些弹幕。玩家这时会把注意力都放在躲弹幕上,没有太多多余的精力去思考别的事。
5、重叠敏感词出场!「哪怕是换成进口鲍鱼也补偿不了我!」这句话出现,其中「口鲍鱼」这三个字会显示在屏幕正中央最显眼的位置。其中,「口鲍」从未在之前游戏中出现,而「鲍鱼」在上一句话中刚刚出现过。因此,中国玩家在躲弹幕的忙乱中更容易注意到「鲍鱼」,而不是「口鲍」。

6、综上,这时玩家的注意力更容易被「鲍鱼」吸引,并为了爆头打出高分会去射击第一个字「鲍」,而这正是两个敏感词「KOUBAO」和「BAOYU」的重叠部分,从而触发一箭双雕。

Bilibili 上一些中国主播玩到这里时的录像:
可以看到基本还原了日文原版的弱引导效果,不过也有一些小缺憾:
- 中文敏感词的重叠部分「鲍」比日文的「チン」更短,更容易点歪。究其原因,是现代汉语词汇以双字词为主,因此重叠部分基本只能是一个字了。
- 半平假半片假的「やりチン」在对话里可能不如全片假名那么显眼,但是「口鲍」的视觉冲击力还是挺强的,玩家此时如果想得比较多就会注意到它并去点「口」,导致触发不了一箭双雕。
因此这里中文版的弱引导效果要比日文原版更弱一些。
结尾
对于大众娱乐作品中的谐音梗,读者看到译文和原文时的内心活动应该是接近的,就像两个相似的高维向量。以传统的翻译方式要做到这一点并不容易,因为它过度依赖译者不稳定的灵光一现。而现在我们可以用机器来对抗这份不稳定性了。当然,最终依然离不开人的琢磨。
另外虽然可能和谐音梗关系不大,台湾 Team9 的汉字解谜游戏《文字游戏》的日文本地化也非常厉害,由发行与本地化公司 FlyHigh Works 的老板黄政凯(日籍,父母台湾人)一人花三年时间完成,工作量要更大。感兴趣的可以读下面扩展阅读里的日媒采访。
关联回答
扩展阅读
- 梁宇熹《关于日本游戏标题的中文译名的考察:游戏在非正规市场中的传播》(日语,出处)
- 汉字解谜游戏《文字游戏》日版译者黄政凯的日媒采访:4Gamer、电FamiNicoGamer
- 知乎问题 - 大模型 Embedding 是可逆的吗?
参考
- 作者表示「久梨子」在游戏实况中有八成概率会被念作「くりこ」 ↩
- 现实中真有叫 Christina 的人用「殷蒂娜」这个中文名 ↩
- 个人觉得这是无奈之举,因为《逆转裁判123》最早的民间汉化就是「保留故事背景在日本」+「保留日文原名」的,《123》的官方中文版也延续了这一点(不过小中大这个海归角色却会说「我的中文不太好」,有点出戏)。到了《456》,也许卡普空是想让中国玩家也感受到人名里的谐音梗,而前作中文版的日本背景又不好改变,于是选择了在日式名字里插入中文谐音梗,但实际效果有点微妙。美版的处理也不是完全没问题,它的设定和日版已经分道扬镳了,并且在《大逆转裁判》的明治背景下显得很扎眼:成步堂是怎么来到加利福尼亚还改姓 Wright 的? ↩