传说中的新版Google翻译到底有多厉害?

上周末,纽约时报的一篇有关于语言翻译技术进步的报道,让许多人为科技发展的速度之快所震撼:该报道指出,Google多年没有过大变化的翻译(Google Translate)服务,即将迎来一次大功能更新,将可以聆听并识别用户所讲的语言,然后几乎实时地将语音翻译为目标语言的文字。这个功能听上去十分强大,看起来Google的自然语言处理技术已经发展的足够好,估计可以让不少翻译和同声传译员工丢掉工作了。

Google翻译是目前全世界最多人使用的翻译产品,支持90种语言之间的互相翻译,包括了阿拉伯语、英语、法语、德语、汉语、西班牙语等在内的所有热门语种。纽约时报的报道显示,web、iOS和Android等各平台上的月活跃用户已经超过了5亿,仅Android版Google翻译应用的下载安装量(这是一款非预装应用)就已经高达1亿。

在机器翻译的领域内主要由三种大层面上的翻译技术门类,分别为“基于规则”(rule-based)、“基于统计”(statistical-based)和混合。其中,Google属于“基于统计”,可以通过用户直接搜索的翻译结果、对网页内容的抓取翻译等多种不同的渠道获取大量的语料资源用于深度学习,从而逐渐获得一种明白两种语言的文字之间如何匹配的能力,并且将这种能力作为服务提供给用户。

显然,这次Google翻译的服务水平又上了一个等级。如果你把你已经安装了Google翻译的手机看做是一个人的话,其实ta已经变成一个翻译效率相当高的电子翻译官了。不过,Google翻译给很多人的印象之前一直不怎么好,比如那些出现在交通标志上、超市甚至厕所里的令人啼笑皆非的翻译,就经常被吐槽为“Google机翻”的结果。人们不由得感叹:Google这么厉害的一家公司,连个机翻都搞不好吗?

fuckgood

一位前Google翻译团队科学家告诉PingWest品玩,Google这个即将发布的新版翻译产品,其背后所需要的研发远比想象的复杂。

过去的Google翻译的功能背后的主要技术是机器翻译(Machine Translation),后来随着Android以及iOS操作系统功能的进步,在移动端支持了语音输入,这又引入了语音识别(Speech Recognition)。“机器翻译和语音识别从技术层面上是单独的产品,背后都会用到很多自然语言处理(Natural Language Processing,NLP),‘深度学习’的基本技术。”这位专家表示。

专家认为,从目前媒体报道和行业了解的信息来看,新的Google翻译是一个将机器翻译和语音识别整合起来的产品,“从技术层面,Google应该早就有能力推出这种功能了(编者注:指语音识别并实时翻译),但是拖到现在才出来,可能会有一些其他的考虑。总的来说,两大技术集成起来需要做大量的优化,而不是简单地拼凑起来。”

也即意味着,新版Google翻译是Google的机器翻译技术和语音识别技术进行了系统性的整合之后投产的结果,将能够代表Google在自然语言处理方面的深度学习所取得的进展,以及其商业化能力。前述的前Google科学家指出,Google的翻译技术在他在职期间(两年前)就已经处在业界领先水平。而这两年以来Google在深度学习方面的进展一直十分突出,因此有理由(比较稳妥地)相信,Google基于深度学习提供的翻译服务,其背后的技术依然可以代表业界的最高水准。

当然,人们对于Google翻译的技术到底有多厉害可能并没有多少感知——他们能够感知到的,其实是不要把干货翻译成f**k good就好。

订阅更多文章