Dark Dwarf Blog background

使用 Transformer 做简单的机器翻译

使用 Transformer 做简单的机器翻译

这个没什么好说的,就是对 Transformer 原论文的简单复现,下面贴一下 Colab Notebook:

可以看到不论是训练速度还是生成结果(这里训练过程没有计算 BLEU 分数了,只是看了 Loss),Transformer 都优于我们之前用 Seq2Seq + Attention 写的简易 NMT。