从这个样本看,Sougou汉译英的质量与Google相比大致相当。从错误类型看,Sogou漏译较多,Google论元关系错误较多。
这个考察样本也比较小,不能全面反映两个系统的实际水平。但对比英译汉和汉译英,两个评测样本的规模大致相当,两个系统的汉译英的错误都明显多于英译汉的错误,也许说明汉译英比英译汉,难度更大一些。
值得思考的问题
从这两个系统的测试结果对比中可以看出一些问题。
(1) 有些语段两个系统都译错了。比如英译汉例2中的
The company has billions of dollars in oil contracts that can go forward only if the United States lifts sanctions against Russia
其结构是S1 S2 Conj S3,其中S表示小句,Conj表示连词。两个系统S2都漏译。
英译汉例3中的
his two-decade relationship with Russia, which awarded him its Order of Friendship in 2013, and with Mr. Putin
其结构是 N1 with N2, RS, and with N3,其中N表示名词短语,RS表示关系从句。两个系统都未能把with N2和with N3连起来翻译。
采用同一个模型的不同系统对于同一个结构的翻译犯相同的错误,也许可以令人怀疑这种模型对于这类结构的适应性。这类结构是否确实包含着本质性的翻译困难?如何解决这种困难?
(2)汉译英比英译汉是否确实更为困难?具体的困难在哪里?黏着语素结构显然是一个不易解决的难点。此外,属于论元关系、核心动词、漏译类型的错误在两个系统中出现的都比较多,这是为什么?如何解决?
基于神经网络的机器翻译出现的时间不长,已经显示出明显的优势。但是任何新方法、新技术都会有不足之处,神经网络机器翻译也不会例外。摸索这种方法的天花板,探寻打破天花板的更新的理论和方法,应当是机器翻译的研究方向。