五十度硅

上层精英的午餐读物

投稿
京ICP备14046667号

那些说Google让专业翻译丢饭碗的人,肯定没用过

请各位亲爱的读者朋友记得,所有没有给出时间期限的科技预测那都是在耍流氓。

当一款新的技术,不,应该说当一个技术出现了一丁点欣喜的进步时,现在科技圈里就立刻往它的身上贴上各种「颠覆」的标签。

如果你是一位科技新闻的读者,想必已经对「颠覆」这个字眼感到些许的麻木甚至恶心了吧?那天翻地覆的变化似乎就要出现在明天。

科技媒体善于吸引人们目光,这固然是从业人员的一种必备本领,但如今所有人都左顾右盼,像是热锅上的蚂蚁一样焦躁不安,这真的是正常现象吗?科技媒体眼中。科技创新把世界世界搅的天翻地覆。没事儿三天一创新,五天一颠覆,未来我们在这个世界站稳脚跟的着力点又是在哪里呢?

在这其中,尤其是以围绕着「人工智能」的呼声最为汹涌澎湃。前不久,Google 推出了基于神经网络而开发的全新的 Google Translate,引起业界的一片惊呼。不少人甚至都建议国家完全没有必要在开设外语专业了,翻译就此在机器学习的带动下彻底消失了!

然而事实上,如果我们站的远一些去看它,如果还模糊不清就再在额头上贴个冰块儿,你就会发现任何有关「机器将取代人工翻译」的言论都是无稽之谈。今天,五十度硅会好好地跟大家掰扯掰扯为什么机器代替不了人工的翻译,并由此我们可以稍微聊一聊人与机器究竟应该保持这样的一种关系。

Google 的神经网络翻译究竟是怎么一回事?

事实上,十年之前网络上就已经提供在线翻译服务了,而其实在很早以前,关于「机器即将替代人类进行翻译」的论调就不绝于耳。而之所以如今大家的目光再次回到这上面,完全是因为 Google 将自己的在线翻译服务进行了升级换代,推出了一款名为基于「神经网络」的机器翻译系统。

咱们先说说什么是「神经网络」?

自打有了计算机以来,努力让机器智能逐渐向人类大脑过渡成为了很多科研人员的一个梦想。但直到如今,在这方面的进展几乎可以用纹丝不动来形容。人们都清楚,机器和人类的侧重点不一样。在机器眼中不费吹灰之力的运算,逻辑判断,这在人类来看是需要大量脑力才能完成的事,而对于人类来说,那些轻而易举就能办到的事,比如辨识物体,人们的身份,自由流畅的语言沟通,迅速地学习并适应某一种方言,这些对于机器来说简直是不可能完成的任务。

在好几次向「人脑」发起冲锋未果之后,研究人员提出设想,为什么我们不搭建一个类似于人脑一样的神经网络呢?让计算机运算单位之间的关系搭建,就完全按照人脑来设计。虽然,

人类至今尚未明白人脑的工作原理,不过这没关系,我们可以先复制出一个人脑的计算模型:一件事情并非像计算机程序那样输入指令输出结果,而是在人脑的多个神经元传递,每个神经元都对信息进行自己的加工,最后输出的结果。计算机科学家用同样的方式,在输入和输出之间,加入了非常多的「节点」,每个节点会对前一个节点传来的数据,按照自己拥有的一个权重系数进行加工,有时候节点还会分层。这就是「人工神经网络」(Artificial Neural Networks,ANN)。

那么,Google 搞得这次基于神经网络的机器翻译系统又是怎么一回事呢?

之前我们经常用到的翻译服务,其实是基于「词组」来进行的。也就是说,一段文字出现之后,系统会直接把这段文字给拆散了,最小单位就是「词组」,然后将每个词组找到相对应的翻译版本,再进行次序的调整,最后出来一篇译文。这是一个有着明确的先后次序的翻译工作,即:打散、找对应的词组、排序、其中包括了标点符号的重新分割,整理等多个环节。

按道理来说它其实不怎么容易出错,但是每一个环节虽然准确率还蛮高,但是架不住环节多啊,一旦有一个地方出现了偏差,后面就如倒掉的积木一样全部都散了架了,最后出来的翻译内容当然不忍猝读。

而基于神经网络的翻译系统,直接跳过了这么多繁琐的步骤,它直接直接依靠「海量数据」来获胜,也就是说它直接建立起来了两个对应着的平行语言库,然后让机器自己去学习如何进行对应。这样的法子其实很早就出现了,但是它也有一定的技术难题没有攻破,比如说机器学习起来速度实在非常慢,而且稍微碰上一些没怎么见过的话,它就不知道该怎么办了,但是 Google 这次通过技术创新,让它无论在翻译的准确性和速度上都获得了大大的提升。

由此,翻译再也不是简单的词与词,词组与词组的对应,而是能够从一段文章的角度去把握全文,这样出来的译文更加流畅自然。

那么,这是不是就意味着人类翻译在此下岗了呢?

既然我们现在知道了 Google 翻译在此取得的重大进展,那么现在是时候把机器和人类放在翻译的天平上称称斤两,比较一下孰轻孰重了!

首先第一点:翻译是一件非常困难的工作,有些翻译甚至是极具翻译才华的人都无法胜任。

机器之所以无法取代专业译员,其实道理很简单:现在在国外生活,能够自由使用两国语言的人那么多,但并不意味着他们就能提供专业的翻译服务。

对于很多翻译工作来说,翻译所要求的并不仅仅是你需要熟悉两国国家的语言文字。很多人觉得翻译无非就是将两种语言字对字,词对词,句对句的对应起来,其实并非如此。译员也不是一本会行走的「活字典」。

更准确的说,他们是两种文化之间的桥梁,在他们大脑对信息的消化、加工、过滤之后,语言不仅仅是从形式上变得熟悉,而在文化上面也尽可能地贴近。有些时候,他们甚至会发明创造一些说法,使得人们更容易接受,有些译员有可能倾其一生,将在两个不同的国家的生活经验灌注到翻译工作中,使得两种文化能够更好的交融。而机器,是无法做到这一些的。

2. 翻译质量没有单一标准。

就算是机器通过了上面这一道关卡的考验,能够轻松承担起各项翻译工作,但是它的翻译质量是否有一个标准进行衡量呢?显然是没有的。你将一段文本交给 100 个人类译员,他们会给你一百种不同的版本,哪种翻译质量高?哪种低?有的也许在行文造句上极为优美流畅,有的则是在逻辑论证上面十分的严谨正式,在面对不同的对象,不同的环境时,考量的标准是不一样的。而人与人之间的交流效果,是无法通过机器来实现单一标准划定的。

它并不是一场象棋比赛,拥有非常客观的逻辑推理。之所以有多个翻译版本,影响因素除了语法上的考量,还有语言深意的侧重点,哪怕是同样一句话,在不同的人那里读起来,因为语调、语气等原因,也会呈现微妙的区别。

3. 世界上的语言种类太多了,远超过你的想象。

现在的 Google Translat 支持翻译 80 种语言,但是如今在我们的世界上,还存在着 6000 到 7000 种语言,其中 2000 种虽然濒临灭绝,但我们就算是拿保守估计来算,这其中有 1000 种语言在经济层面具有重要影响力,那么 Google 即还得去征服 920 种语言,就算是每年 Google 的翻译能力扩张 10 种语言,那么 92 年之后,Google 翻译才算是勉强覆盖了人类的语言图谱。

4. 语境是关键。

就拿英语来举例子好了,几乎没人知道,一个单一的词汇会有几百种的意思,这完全取决于当时说话的语境是什么。事实上,牛津英语词典中光是「Run」这一个单词,就至少有 645 种不同的意思。一台电脑真的不仅仅能在一种语言中识别这么多的意思,而且还能在两种语言中找到一一对应关系吗?

换句话说,词与词对应的翻译是不现实的,真正的翻译不是从「字词」去着眼,而是将「语境」和「意义」两者结合起来。而这两者结合起来的方式还在不断地发生着变化,这种变化背后的动因,则是来源于人们大脑无限的创意。机器,在短时间内是无法跟得上这个步伐的。

5. 商业开发领域,语言真的是太重要了,其重要程度决定了翻译必须依赖于人类。

你的公司在描述你的产品和服务的时候,你知道你所采用的语言扮演多么重要的角色吗?顾客们在做购买决策的时候,与这些话之间会产生千丝万缕的联系。在商业宣传的翻译领域,机器是否能够达到俘获人心的作用呢?

一家大公司在施展自己的全球化战略时,势必要进行很多本土化的营销工作,这些翻译工作必须依赖于人来完成,因为只有人,才能说出贴合人心的话。(这个判断至少在我们有生之年是成立的。)

所以,鉴于以上的几点原因,机器翻译在短时间内是不会颠覆翻译这个领域,那么为什么每次科技界有一点点的动静,全世界的人都在庆贺,好像明天翻译就被机器取代了似的?

最后的话

请各位亲爱的读者朋友记得,所有没有给出时间期限的科技预测那都是在耍流氓。在没有时间框架的制约下,科技小编们的想象力就像是蝴蝶一样纷飞,这样的场景固然美丽,但是蝴蝶所到之处洒下来的,却是不必要的恐慌和焦虑。

「颠覆」和「取代」,这样的词内含着一种非此即彼,简单粗暴的逻辑,它描绘起来快速省事儿,直接刺激大脑皮层的快感;但是现实往往是影响,融合,改变,这样的过程复杂且充满变数,而我们所面对的世界往往总是如此,人与机器如何能够更好的协作分工,这才是每个人应该思考的问题以及努力的方向。

最后,还是说回到我们这片文章的主题:机器是否能够替代人工翻译?其实「不能替代」的核心原因只有一个:文化与文化相互之间的学习,融合,只有通过「人」这个媒介才能完成。机器只是翻译领域一个更加趁手的工具而已。正如电子商务的出现无法替代人工销售。哪怕是持有同样一种语言的人,销售有时候还是凭借人本身才能完成的。

本文作者花满楼,文章首发于今日头条、微信:50度硅-面向上层精英的早午餐读物。未经直接授权禁止转载(标注出处也不可以),如需转载,请与微信号t2ipo001联系,并注明来意。

评论于站点 回复 评论 删除 隐藏

评论于站点 回复 删除 隐藏