微軟亞洲研究院與雷德蒙德研究院的研究人員於昨(14)日晚上宣布,其研發機器翻譯系統在通用新聞報導測試集 newstest2017 中,中翻英測試上已達到了可與人工翻譯媲美的水準,這是第一個在新聞報導翻譯上兼顧品質與準確率可以與人工翻譯相比的翻譯系統。

此次機器翻譯之所以能有所突破,是仰賴四大技術,分別是對偶學習(Dual Learning)、推敲網路(Deliberation Networks)、聯合訓練(Joint Training)和一致性規範(Agreement Regularization)。而由於機器翻譯並沒有所謂「正確」的翻譯結果,因此需要訂立一個能夠界定翻譯成效的標準,這個標準就是人類翻譯水平,而為了定義這個水平,其論文中指出需滿足兩大條件,分別是機器釋出的譯文品質經擁有雙語能力的人類判斷與人類品質相當,以及機器翻譯系統在測試集上的譯文品質得分(人工評分)與人類譯文得分沒有顯著差別,若是滿足此兩大條件,則機器翻譯達到人類翻譯水平。

科研人員也解釋四大技術的概念,指出「對偶學習」是指利用文本中翻英與英翻中雙向結構來促成機器學習,推敲網路則是讓機器在執行完翻譯任務後,不會當下即結束,而是會反覆推敲確認是否正確,與人類寫考卷時會重新檢查錯誤的意思一樣,而聯合訓練是利用機器雙向翻譯之下,反覆推敲所產生的新句對來擴充翻譯數句內的文本數量,最後一致性規範是一個對翻譯對左到右和從右到左的結果進行約束,這個約束,應用於神經機器翻譯訓練過程中,以鼓勵系統基於這兩個相反的過程生成一致的翻譯結果。

這一次的成果讓研發團隊感到滿意,翻譯應用的新聞報導測試集,也是由來自產業界和學術界的團隊共同開發完成的newstest2017 測試集,除了新聞類 ( news) 外,另外兩類分別是生物醫學(biomedical)和多模式(multimodal)。

微軟機器翻譯團隊研究經理 Arul Menezes 表示:「團隊想要證明的是:當一種語言對(比如中─英)擁有較多的訓練數據,且測試集中包含的是常見的大眾類新聞詞彙時,那麼在人工智慧技術的加持下機器翻譯系統的表現可以與人類媲美。」

微軟亞洲研究院副院長、自然語言計算組負責人周明則表示:「在 WMT17 測試集上的翻譯結果達到人類水平很鼓舞人心,但仍有很多挑戰需要我們解決,比如在即時的新聞報導上測試系統等。」

延伸閱讀:

微軟供全台學生免費雲端 打造智慧校園