搜尋引擎Google的Google Translate被許多人使用翻譯外國語言,但卻被網友揪出一句離譜的「雙重標準」翻譯錯誤。臉書粉專「前線科技人員」指,17日網上瘋傳Google Translat把「China breaks promise(中國破壞承諾)翻譯成「中國信守諾言」,但「US breaks promise(美國破壞承諾)」就會翻譯做「美國違約」。不過,專家指出,這可能是某一國家或某種語言媒體經常將China breaks promise在網路上刻意翻譯成「中國信守諾言」,才導致Google Translate鬧出「親中搞雙標」的笑話。
經實測,各種語言的「中國破壞承諾」都會被Google Translate翻譯成「中國信守諾言」,若把台灣、香港、澳門替換中國兩字,也會出現同樣錯誤情況。而Google翻譯並非首次出錯,前年反送中運動其間,有香港網友發現將「so sad to see Hong Kong became China(我很難過看到香港變成中國)」翻譯成中文時, Google竟翻譯成「很高興看到香港成為中國」。Google發言人當時向法新社說明,由於使用自動系統,有時會出現無心錯誤,例如把負面譯成正面字眼。
據了解,Google Translate原理是放棄文法,純粹用網上大量數據建立模型,而其數據資料庫大部份資料均從公開途徑獲得。當時就有網友分析,問題不是出在Google,而是有人惡意引導。Google的搜尋跟翻譯後面都是透過特定演算法去處理,去年曾有發生過,在Google圖片搜尋「白癡」,會跑出川普的照片,是因為有特定團體通過在川普的照片標注白癡所造成。而Google翻譯問題也是用「類似的手法」,加入 Google的翻譯社群,然後多次給予特定句子錯誤的翻譯,最後讓所有人在輸入特定句子時,跑出主導者所想要的結果。
「前線科技人員」專頁解釋,幾十年前舊式電腦翻譯主要方法是教電腦程式辨認不同文法,但由於人類語言文法有大量例外用法,令效果一直強差人意。近十多年來Machine Learning(機器學習)開始普及,研究人員開始循另一個方向解決電腦翻譯問題,嘗試放棄文法,純粹用大量數據去建立模型,事實證明效果比傳統方法更好。但Google的數據庫大部份資料從公開途徑獲得,如果某一國家或某種語言媒體經常將China breaks promise在網路上翻譯成「中國信守諾言」,大量假資料就會造成AI誤判進而讓Google Translate出包。