據國外媒體報道,谷歌昨日發布了谷歌網頁和手機版的翻譯。在漢英翻譯過程中,將采用全新的神經機器翻譯,該應用程序將每天進行1800萬次翻譯。谷歌出版了一篇關于翻譯系統操作原理的學術論文。
早些時候,Google表示在Google翻譯中使用了神經網絡技術,但只用于實時的視覺翻譯。不久前,Google高級雇員杰夫·迪恩(Jeff Dean)告訴VentureBeat,Google正試圖將越來越多的深入學習能力整合到Google翻譯中。谷歌發言人在一封電子郵件中告訴VentureBeat,最新的神經機器翻譯是他們努力發展深入學習的結果。
事實上,Google一直在努力將深度神經網絡集成到越來越多的應用程序中,包括Google Allo和Gmail的收件箱。這個功能幫助Google更高效和高效地處理他們的數據。
Google的神經機器翻譯(GNMT)高度依賴于8層短期記憶遞歸神經網絡(LSTM-RNs)。層間殘差關系可以增強梯度流。谷歌足夠成熟,可以用未發布的張量處理單元處理數據。
雖然神經機器翻譯并不總是最好的選擇,但谷歌的各種嘗試表明,在某些情況下,它仍然是例外。
系統評價表明,與以往的基于短語的翻譯系統相比,包括英法翻譯、英西翻譯和英漢翻譯,神經學習翻譯系統的錯誤率降低了60%。在翻譯質量上,翻譯系統將更接近譯者的平均水平。
Google Brain Team的研究與開發科學家Quoc Le和Mike Schuster在昨天發表的一篇博客文章中指出,在雙語評分員的幫助下,在維基百科上翻譯多語句子的錯誤率實際上已經降低了55%到85%。
盡管如此,系統還不完善。神經機器翻譯仍然會犯一些譯者永遠不會犯的錯誤,如遺漏單詞、把常用名詞或罕見的專有名詞弄錯了,以及缺乏對文本上下文的全面控制。但不可否認的是,神經機器翻譯具有里程碑意義。