介绍

谷歌翻译的效果非常好，它通常看起来很神奇。但这不是魔法——这是深度学习！

在本系列文章中，我们将向您展示如何使用深度学习来创建自动翻译系统。本系列可被视为分步教程，可帮助您理解和构建神经元机器翻译。

本系列假设您熟悉机器学习的概念：模型训练、监督学习、神经网络以及人工神经元、层和反向传播。

在深入了解使用深度学习(DL)进行翻译的具体细节之前，让我们快速了解一下机器翻译(MT)。

机器翻译简史

MT的概念，或使用机器自动将文本从一种自然语言翻译成另一种语言的能力可以追溯到1949年，当时Warren Weaver制定了主要的MT原则。最初，MT是使用专家规则(RBMT) 完成的，这需要人工翻译的大量工作。然后，在1970年代后期，统计机器翻译(SMT)出现并迅速蓬勃发展，尤其是在IBM资助的Candide项目的帮助下。

SMT基于计算从文本语料库（原始语言和目标语言）中提取的词和句子对之间最可能的关系。SMT一直统治着MT领域，直到2000年，当时提出将神经网络应用于MT——神经机器翻译(NMT)——作为替代方案。

虽然NMT一开始并不成功，但多年来取得了令人瞩目的进步。随着最近AI处理能力（GPU卡等）的增长，NMT开始提供优于SMT的结果。

随着对DL和长短期记忆(LSTM)设计的持续研究，NMT获得了越来越令人兴奋的结果；NMT取代商业翻译软件中的大多数SMT可能只是时间问题。

深度学习擅长MT，因为它旨在创造一个人工大脑。理论上，人脑能做的一切，深度学习系统也能做。此外，LSTM——一种深度学习技术，或者更准确地说，一种循环神经网络（RNN）——在回忆和检测时间模式方面有着前所未有的记录。当将自然语言句子视为单词的条件时间序列或作为马尔可夫过程的结果时，这非常有用。