基于依存距离惩罚的泰汉神经机器翻译方法
张弘弢 文永华 王剑
在“一带一路”倡议的背景下,泰国与我国的沟通日益密切,泰汉机器翻译具有很高的应用需求。作为低资源语言机器翻译,泰汉之间缺乏大规模、高质量的平行语料,导致翻译效果不佳。融入依存句法知识可以使译文更符合句法约束,弥补没有大规模平行语料的缺陷,但泰语缺少成熟的依存解析工具和依存标注训练集。针对以上问题,基于无监督迁移获取泰语依存句法结构知识,并提出依存距离惩罚机制以减少依存噪声对翻译性能的干扰,并通过基于依存感知注意力机制的Transformer架构将所提方法融入翻译。实验结果表明,该方法能有效提升泰汉神经机器翻译的效果。