谷歌称人工智能让机器翻译水平大增,进步超过去10年总和
文/腾讯科技 俞斯译
拥有18年历史的谷歌正在利用人工智能和机器学习技术给自己的产品进行一次“翻新”和“升级”。
近日,这家科技巨头宣布,基于上述技术开发的神经网络机器翻译系统(GNMT:谷歌 Neural Machine Translation),正式被应用到谷歌翻译中。
抛开这个有些晦涩的技术名称,简单来说,它在两方面给谷歌翻译带来了巨大改变。首先,翻译单位由“单词”、“短语”变成了“句子”,能够对整句进行充分理解和翻译;其次,在整句翻译之后,还能够在更广泛的语境中进行调整,找出最相关的语言和词汇,来进行再次调整和安排,最终让翻译出的语言更自然顺畅。
谷歌翻译产品经理Barak Turovsky在视频采访中告诉我们,新的机器翻译错误率减少了55%—85%。目前,35%的在线翻译需求,已经可以使用神经网络机器翻译。
作为谷歌旗下最成功的产品之一,每月有超过5亿人使用谷歌翻译。每天要完成10亿次翻译,涉及的单词量超过1400亿个。庞大的用户量和翻译需求量,使得每一次微小的技术改进都会产生巨大的影响。
“神经网络机器翻译系统是一个重要里程碑,此次更新对谷歌翻译的改进远超过去十年。”谷歌在新闻稿中对于这次技术提升给予了极高评价。今年4月,谷歌刚刚庆祝了谷歌翻译上线十周年。而这次的重大技术更新,也成了工程师们给这款产品最好的一份礼物。
与以往翻译技术的改进不同,这次神经网络机器翻译系统能够像人类一样,拥有自我学习的能力。
根据Barak Turovsky的介绍,机器学习和训练首先需要大量样本,谷歌翻译过去10年积累的海量翻译数据正好提供了这样一个学习的土壤。然后借助TensorFlow开源机器学习平台就可以进行大规模的训练和自我学习,而为了确保翻译的速度,谷歌还专门为机器翻译研发了一款名为TPU的硬件,比世界上现有正在使用的处理翻译的软硬件要快3倍。
目前这项翻译技术已经支持包括英语、法语、德语、西班牙语、葡萄牙语、中文、日语、韩语、土耳其语这八组语言的互译,谷歌接下来的目标就是进一步推广到103种语言,覆盖全球99%的人口。
(编辑: xueqi)