近日,在AI语音识别领域颇有建树的科大讯飞陷入“AI同传造假”风波。有同声传译员曝料称,在一场国际会议上,科大讯飞的AI同声传译并非来自机器,其实是在“复读”人工翻译,而且并不准确,错误频出。
科大讯飞对此回应称,自己从没讲过AI同传的概念,始终强调是人机耦合的模式,人工智能目前还无法替代同传,人机耦合才是未来发展之道。
据最新了解,曝料译者已经与科大讯飞进行了一个多小时的直接沟通,并通过一篇长文做出了最新回应和解释。
译者称自己最初曝料时情绪比较激动,措辞也比较激烈,此番沟通中重点提出了现场字幕、TSS语音合成直播同传、讯飞营销和公关不足等问题,对方都一一做了解释。
译者认为,科大讯飞展现出了诚意,沟通过程中一直友好理性,这次的解释是让能够接受的,可以认为讯飞没有主动造假的行为,但是讯飞的营销和公关存在比较大的问题,客观上放任了媒体的过分宣传,导致了各方的误会。
以下为译者回应文章原文:
昨天,我得知科大讯飞想要和我进行沟通,将事情来龙去脉解释清楚并澄清一些误会。我觉得这样做确实会让事情清楚一些,比两边隔空喊话要高效很多,于是就答应了。
今天,我就与科大讯飞消费者事业群副总裁,听见科技总经理王玮女士进行了语音沟通。整个交流持续了大约一小时十分钟。我们双方都留了录音。
一开始我先解释了下在文章中我的一些激烈用词(囧),确实是情绪有些激动,比较不好意思,然后我就提出了在我文章中主要的几个问题。
一个就是现场字幕的问题,事先我并没有得知有讯飞参与,也没有人征求我的同意,并且只有“讯飞听见”几个字还是很容易让观众误解为是讯飞提供的字幕翻译,也会让同传译员误解,感觉受到不尊重。
二是直播的同传音轨使用tts语音合成而不是直接用同传译员的翻译音轨,同时知领的直播介绍中的文字说有“智能翻译”功能,对观众非常有误导性,有欺骗嫌疑。
同时还提到了我后来想到的一点,就是讯飞作为这样一个大影响力的公司,是不是在营销和公关上控制不足,导致很多误会。
王女士先解释了第一点。讯飞听见之前也在几次比较有影响力的会议上有所使用,应该已经有不少人熟知,而这次的会议其实有很多的承办方,并且有会务公司和翻译公司的参与。王女士表示科大讯飞在多次的筹备会议中明确要求要通知到所有相关方会有讯飞听见的字幕技术应用和展示,是不是哪一环沟通出现了问题。
这一点上,我倒确实后来听相关方说,跟我确定会议相对晚,据说其他译员老师被通知了,可能是因为我确定晚漏了我一个。
那这点上我觉得这个解释可以接受,但遗留的问题就是,这种情况下造成的误解不仅针对译员,在现场关注会议的听众,新闻报道的受众,以及网上直播的观众都可能会误解为翻译是讯飞提供,因为不是所有人都熟悉讯飞听见。
第二点第三点牵涉的问题就比较复杂。王女士解释说其实他们考虑过如果用人工语音来替代翻译的语音确实会比较奇怪,(同时也向我提问,是否以后遇到这种情况可以寻求同传译员的许可,打出老师的名字或贴上老师的照片,或至少用文字标识表明有同传译员在翻译。这一点后面我们进行了讨论。)
但最终结果是经过讨论,讯飞还是提供了tts的技术支持,目的是为以后可以实现的多语言平台进行演练(这里王女士解释了,比如一共有五种语言的与会者,可能一个小语种找不到翻译,那么可以借由其他译员翻译出来的文本作为中心语言,然后文本翻译到该小语种,再人工语音输出)。
所以讯飞就提供了技术支持,但后续没有进行足够的把控,造成了译员感受到了侵犯,确实考虑不周。
我就进一步提出,后续没有控制,如果真是本身没有这种意愿,最终出现这种情况,那其实就是讯飞的营销或是公关部门工作问题,如果控制得好些,完全可以在同传语音保留的情况下增加第三个tts的频道,在对比下更能展示技术。王女士承认这方面确实本应做得更好。
然后我跟着说,讯飞确实官方多次声明提到过没有取代人工同传的意思,那么基于这种考虑,营销和公关部门应该是在媒体夸大炒作之后尽快进行辟谣和澄清,而不是等到夸大宣传激起激烈反弹后再应激式地去救火,还会让人感觉是讯飞默许了这种夸大宣传,客观上还从中得到了好处。
而且舆论先受到了媒体炒作的影响(同时讯飞澄清不够),觉得讯飞的AI技术已经无所不能,远超讯飞自己的定位,结果这次出了这样的一个事件,很可能很多人态度又会180度转弯,瞬间觉得讯飞一无是处。
王女士回答说确实作为一个科技公司在这方面缺乏经验,这次也是第一次他们遇到这么大的舆情事件,让他们感觉也很被动。而且现在社会中舆论容易被媒体影响,信任危机让人们很容易由于一次事件就完全失去信任。
我就提到,讯飞作为多种程度上承载很多中国人希望的公司,如果不能做到对于这样的社会现状有准确的判断,进行前瞻性的准备而不是放任事情直到出事再救火,那么工作肯定是有问题的。
王女士承认这是一次教训,事先的管控确实出现了问题,以后在面对可能的类似事件之前也需要进行预防性澄清。
至此第二点和第三点解释完毕。
在结尾我们还做了更多沟通。我提到在同传的业界中,(不论是否由讯飞导致)曾经出现过不止一次译员“被AI”,感觉到被免费利用,也有讲者在会上讲类似“感谢这次的人工智能同传,相信人类很快就要被取代”的话。
王女士这时主动提出,她也听到过同传界或翻译公司的建议,是否应该在以后牵涉到讯飞提供技术的会议中,要与译员沟通,得到知情同意并签订协议。
我说确实需要这个机制,而且协议需要分为两部分,第一部分是对于讯飞在会场提供的技术支持进行解释,包括呈现方式和运用的技术和其用途,需要得到译员的同意,并且需要在会场明确进行标识,说明翻译由译员提供;第二部分是关于译员翻译出来的内容,如果需要后续使用该内容(如用于语料积累或模型训练等),必须得到译员同意,否则不可使用。也就是说,一定要规范。
另外,因为这次影响很大,很多我的同行都各自发声,有相对些激进,有些相对克制,我建议讯飞可以找机会跟同传界多进行正式的沟通,争取解除不必要的误会,寻求真正合作的可能。
总结:
我觉得科大讯飞的王玮女士展现出了诚意,沟通过程中一直友好理性。这次的解释是让我能够接受的,从我的角度看,可以认为讯飞没有主动造假的行为,但是讯飞的营销和公关存在比较大的问题,客观上放任了媒体的过分宣传,导致了各方的误会。
讯飞表示在以后的工作中需要更有前瞻性,在营销和公关的把控上必须严格,要在发现媒体过度宣传的时候就尽早进行澄清,并且在以后可能的技术呈现过程中充分做好标识,避免误会。
最后我们进行了更多交流,我提出建议,讯飞在未来与译员可能合作时,需要得到译员的知情同意,并签订协议,而且需要应用译员知识产权的翻译内容时,也需要得到许可,否则不可使用。讯飞承诺将尽快探索这一机制并执行。并且,这次事件激发了很多来自业界的讨论,我也提出希望讯飞能主动进行联系沟通进行澄清。
最后补充几句题外话:
本身我写前一篇文章的时候,考虑得也十分简单,就是感觉受到了不公的待遇,要将自己的经历写出来。而且当时多少情绪也比较激动,有些措辞比较激烈。
结果后来自然也被解读了,还有人说我是“带着任务来的”。之后事情影响越来越大,各个媒体,甚至外媒都开始报道以及引用我的文章。
不仅如此,业内的朋友们也开始在我身上寄托很多期望,希望维护合理的权利和诉求。这时我才意识到,发声一定要谨慎,即使我描述了事情的经过,但几句不谨慎的话还是会引起麻烦。于是我决定不再评论回复(看都不看了,免得心烦),也拒绝了所有媒体的采访请求。
这里还是再说一遍,我从未委托任何人代替我发声,我自己说的也仅仅代表我自己,我也没有权力代表同传行业,我只能从自己的角度去聆听,并得出自己的结论。但这次我觉得最有价值的还是结尾的讨论。
澄清事件解释误会都只是对过去的总结,关键还是在于事件能否对未来有积极的影响。如果这次事件真的能建立事先沟通机制,保护好译员的权利,规范化知识产权的使用,并且能让大家理性看待AI技术,不要不理性地拔高或贬低,那我觉得这次事件就不是一次闹剧,而是一次真正产生价值的事件。
这次应该还是会不看评论不回复。