2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > (六)多语言人工智能语言翻译

(六)多语言人工智能语言翻译

时间:2023-04-01 17:59:34

相关推荐

(六)多语言人工智能语言翻译

目录

介绍

翻译多种语言

下一步

下载源文件 - 3.5 KB

介绍

谷歌翻译工作得如此之好,它通常看起来很神奇。但这不是魔法——这是深度学习!

在本系列文章中,我们将向您展示如何使用深度学习来创建自动翻译系统。本系列可被视为分步教程,可帮助您理解和构建神经元机器翻译。

本系列假设您熟悉机器学习的概念:模型训练、监督学习、神经网络以及人工神经元、层和反向传播。

我们在上一篇文章中取得的成果很好,即使它还没有完全准备好取代谷歌翻译。在本文中,我们将在其他语言上训练和测试我们的翻译模型。

翻译多种语言

我们在这里创建的函数将使用我们开发的模型支持从一种语言到另一种语言的自动翻译。

欢迎您将代码下载为Google Colab文件。

我们的应用程序将能够从制表符分隔的平行语料库中创建模型,例如来自Tatoeba项目的语料库。

查看我们的代码,您会看到我们已将训练模型所需的所有内容分组到一个train_model函数中,以及一个translate函数,该函数接收一个包含模型输入语言文本的文件并将其翻译成模型的输出语。

让我们用一个包含一些我们希望翻译的英文文本的文件来运行我们的工具——f test.txt,其中包含:

this is a test hellocan you give me the bill please where is the main street

translate("rus.txt","test.txt","model12")

我们得到以下输出:

input model translation0 this is a testэто тест1 hello привет 2 can you give me the bill please не можете мне пожалуйста 3 where is the main streetгде здесь улице

结果是正确的,除了第三行。

现在让我们训练然后使用法语翻译器:

train_model("fra.txt","model_fr")translate("fra.txt","test.txt","model_fr")

input model translation0 this is a testc'est un d'un1 hello 2 can you give me the bill please tu me donner la s'il te prie3 where is the main streetoù est la rue est rue

结果很糟糕。只有第四句话被翻译得比较容易理解。原因是法语的复杂性,以及与俄语数据集相比,训练数据集相对较小的事实。

这是从英语到德语的自动翻译结果:

input model translation0 this is a testdas ist eine test 1 hello2 can you give me the bill please könntest sie mir die rechnung geben 3 where is the main streetwo ist die straße

这几乎是100%完美的。

最后,让我们看看同样的方法将英语翻译成荷兰语的效果如何:

input model translation0 this is a test dit is een nationale 1 hello hallo 2 can you give me the bill please kunt je me instapkaart geven 3 where is the main street waar is de bushalt

不完美“主街在哪儿”翻译成“公交车站在哪里?”,“can you give me bill please”翻译成“can you give me the boarding pass”。

如您所见,根据语言和训练数据集的大小,我们得到了非常不同的结果。

下一步

正如我们所见,我们能够构建一个非常好的机器翻译系统,而无需编写数千行代码或在GPU上花费数千美元来训练或建模。当然,与大多数深度学习任务一样,您的训练数据集越大(并且您可以花更多时间训练它),您的翻译模型就越准确。

有很多方法可以为机器翻译构建ML系统。我们只是探索了其中之一。或者,您可以使用卷积神经网络(CNN)代替RNN,或使用Moses之类的软件;将统计机器翻译与深度学习模型相结合。

既然您已经看到了AI语言翻译的实际应用,您可能想尝试使用Transformers进行AI翻译。Transformer是一种完全基于注意力的自然语言处理任务的最先进方法。它们根本不像我们创建的模型那样使用序列。尽管Transformer是新的,并且不像基于序列的AI翻译那样得到大量研究的支持,但看起来Transformer将成为许多自然语言处理任务的未来。

/Articles/5299750/AI-Language-Translation-With-Multiple-Languages

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。