WIPO翻譯現納入了尖端類神經機器翻譯技術,將高技術專利文件轉換為第二種語言,並且風格和句法更貼近通用說法,勝過其他建立在以往技術上的翻譯工具。
WIPO首先“訓練”了將中文、日文和韓文專利文件翻譯為英文的新技術,這些語言的專利申請在2014年約占世界專利申請量的55%,使用者目前可以透過公共測試平臺來試用其中英翻譯工具(http://patentscope.wipo.int/translate/demoNmt.jsf)。
中英翻譯的高準確性是訓練類神經機器翻譯工具的成果,該工具 將SIPO提供給WIPO的PATENTSCOPE數據庫的中文專利文件裡的6,000萬句話,與其在美國專利商標局提交的翻譯相對比。WIPO計劃將類神經機器翻譯服務擴大至用法文提出的專利申請,其他 語言緊隨其後。
類神經機器翻譯是一個新興技術,它建立在龐大的、能夠“學習”之前翻譯過的句子的類神經網絡模型上,類神經機器翻譯的特點在於其產生了更為自然的語序,並在所謂的差異性較大的語言之間,如日文與英文或中文與英文中有顯著的進步。
在最近的一次測試中,針對差異性較大的語言之間,WIPO的類神經機器翻譯表現遠超過之前基於統計的模型,及其他非WIPO的翻譯服務,由於該WIPO工具受過訓練,並且僅針對專利文件,而非一系列差異更大的文本,它能產出更高質量的譯文。舉例而言,以下中文文句如採用先前的WIPO翻譯工具翻譯為英文文句,則將翻出(1)所示之結果,其語序並非一般慣用的英文文句之語序,而僅是對照中文文句之語序而得,但若以類神經機器翻譯進行,則將翻出(2)所示之結果,其語序則較貼近一般慣用的英文文句之語序。
資料來源:WIPO,2016.10.31
http://www.wipo.int/pressroom/en/articles/2016/article_0014.html
http://www.wipo.int/pressroom/zh/articles/2016/article_0014.html