看板 Gossiping作者 IN (願自身光明熾然照耀世界)標題 [新聞] Google發布類神經機器翻譯 翻譯品質接近時間 Wed Sep 28 22:41:32 2016
Google發布類神經機器翻譯 翻譯品質接近筆譯人員
TechFeed 科技讀報 2016-09-28
Google於昨日發布了網頁版和行動版的Google翻譯。在中翻英的過程中,會採用全新的類
神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,Google針對這個
翻譯系統的運作原理,發表了一篇學術論文。
之前,Google就曾表示它們在Google翻譯中運用了類神經網路技術,但只限於即時視覺翻
譯這個功能。前段時間,Google的資深員工Jeff Dean曾告訴VentureBeat,Google已經在
嘗試把越來越多的深度學習功能融入到Google翻譯中。除此之外,Google的一位發言人在
郵件中說,最新的類神經機器翻譯是他們努力研發深度學習功能的成果。
實際上,Google一直以來都在致力於將深度類神經網路融入它旗下越來越多的應用軟體中
,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助Google更快捷、更有效地
處理它們的數據。
Google的類神經機器翻譯(GNMT)對八層長的短時記憶遞歸類神經網路(LSTM-RNNs)依
賴性很強。 “通過層間殘留聯繫可以加強梯度流。”Google科學家在論文中寫道。在影
像處理器的幫助下,類神經網路一旦變得足夠成熟,Google就可以靠它尚未發布的張量處
理單元進行數據處理。
雖然類神經機器翻譯並不永遠是最佳之選,但是Google的各種嘗試顯示,在某些情況下它
還是有過人之處的。
https://techfeed.today/wp-content/uploads/2016/09/57eb0b92f38de.png.jpeg
“人們對這個翻譯系統的評價顯示,比起之前基於短語的翻譯系統,在翻譯多種語言時,
類神經學習翻譯系統的錯誤率已經降低了60%,其中包括英法互譯,英西互譯以及英中互
譯。附加實驗的結果顯示,翻譯系統的品質將和筆譯人員平均水準更加接近。”
在昨天發表的一篇文章中,Google Brain Team的研發科學家Quoc Le 和Mike Schuster提
到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,Google類神經機器翻
譯的錯誤率實際上已經降低了55%到85%。
儘管如此,這個系統還是不完美的。 “類神經機器翻譯還是會犯一些筆譯人員永遠都不
可能犯的錯誤,比如漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章
語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,類神經機
器翻譯具有里程碑意義。”
新聞連結:
http://tinyurl.com/j9h6qjb
Google論文原文:
http://arxiv.org/abs/1609.08144
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.130.168.122
※ 文章代碼(AID): #1NwzQeQV (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1475073704.A.69F.html
※ 同主題文章:
[新聞] Google發布類神經機器翻譯 翻譯品質接近
09-28 22:41 IN.
推 SRNOB: 阿兩傑作4F 09/28 22:42
推 oijkue: may sure gun more5F 09/28 22:42
推 alog: 沒關係 google小姐還不會實況 跟不會翻譯動畫7F 09/28 22:43
推 oncemore: error要低於專業翻譯還有很長一段路要走14F 09/28 22:43
→ a1091100075: 不過地球人口真的過剩了 多點科技發展淘汰掉些沒必要16F 09/28 22:44
→ agong: 情慾流動 Lust flow17F 09/28 22:44
推 sellgd: 已超越Bing translator了嗎18F 09/28 22:44
推 followwar: GOOGLE最近一篇wavenet可以製造出接近人類發聲的語音20F 09/28 22:44
噓 shadeel: 不會再出現烘手機(bake cell phone)這種東西了吧26F 09/28 22:45
→ followwar: 深度學習出現到超越人類的圖形辨識能力只花了4年27F 09/28 22:46
推 sellgd: 如果超越Bing translator 我才會怕一些些28F 09/28 22:46
推 tomer: 類神經啊 ...阿發GO幫翻譯的意思嗎29F 09/28 22:46
→ w3160828: 他末段出現的錯誤 現在一堆翻譯人員也長出包 至少贏台灣30F 09/28 22:46
→ sellgd: 英中互譯還有一段時間,歐語之間才比較要先怕
GNMT的網址和以前Google translate一樣嗎31F 09/28 22:46
→ kuninaka: 洪蘭的書丟給這個會不會比較好33F 09/28 22:47
→ a1091100075: 還好 等中譯英達到人所翻的品質時 我大概也差不多噶35F 09/28 22:48
→ ev331: 那如果大家都看的懂中英日語咧 你會不會怕39F 09/28 22:49
→ w3160828: 現在已經贏過台灣人翻譯了 雖然是出版社用人問題40F 09/28 22:49
→ QQDK: 所以說理組立國 文組誤國 在任何時代都適用啊42F 09/28 22:50
→ ev331: 立個屁東西 立到自己都被革掉43F 09/28 22:51
推 netio: 看成Google發神經44F 09/28 22:51
→ ev331: 沒人就變機器共國國了45F 09/28 22:52
推 fyer: 不用學英語了46F 09/28 22:52
→ ev331: 共和國了
不學會變笨哦47F 09/28 22:52
→ DrTech: RNN + LSTM 翻譯還蠻常見的阿49F 09/28 22:52
→ ev331: 今天有基因改造人的新聞
基改人 不遠啦50F 09/28 22:52
→ DrTech: 不過用了8層倒是第一次看到。52F 09/28 22:53
→ ev331: 枱面上都這樣了 私底下不知道有沒有人偷偷做了53F 09/28 22:53
推 BBQ2591: 跟我想的一樣 就是類神經系統嘛54F 09/28 22:55
推 bill0205: 先學會如何100%完整詮釋英翻中 中翻英55F 09/28 22:56
→ ev331: 反正就是死不到自己沒關係的概念56F 09/28 22:56
→ amaki: 這玩意超威的,翻譯領域、外文等科系幾乎等於被判死刑...59F 09/28 22:58
推 menshuei: 有個東西就是太口語的東西無法翻,另有些拼音語言常常使用簡寫,但是機器還未有考量的到這一點。60F 09/28 22:59
→ amaki: Google還刻意第一時間選擇arXiv平台發表論文63F 09/28 22:59
→ typecommand: 我比較想看到可以即時翻譯中日文,這樣ptt-2ch合併,一定很有趣64F 09/28 23:00
推 akway: 就是阿發狗那套技術拿來用 這下翻譯真的會gg66F 09/28 23:00
→ loking: 口語的也可以翻阿 training時餵進去就好了68F 09/28 23:04
→ amaki: 我如果是外文科系學生或工作人員,現在就會開始瘋狂找後路70F 09/28 23:06
推 oherman: 應該比洪蘭翻譯強1000倍71F 09/28 23:09
推 teiai: 翻譯翻譯什麼叫他媽的驚喜72F 09/28 23:14
推 orze04: 有種去翻日文73F 09/28 23:24
推 ksxo: 以後可以拿來和洪比看看了74F 09/28 23:28
推 BIGETC: 股溝好邪惡RRR76F 09/28 23:29
推 waiter337: 我覺得要分成好幾種個性來區分比較好78F 09/28 23:32
推 stella323: 如果可以未來直接植入人腦大家不久各種語言都會79F 09/28 23:32
→ waiter337: 向鄉民的翻譯方向 官員的翻譯方向書本的翻譯方向
如果要改變情緒 要傳遞給另一台情緒翻譯才可以翻完80F 09/28 23:33
推 mithuang: 理組又害文組少一種工作了...82F 09/28 23:36
推 orze04: 隨便抓一篇論文就一堆翻錯或不順zzzzz83F 09/28 23:36
推 sinaviva: 以後就讀原文小說就好啦 現在好像也是87F 09/28 23:55
推 a1qazbgt5: 人腦就是神經原為零件組成的機器 人做得到事的沒理由機器不行89F 09/29 00:11
推 lyu0001: 別小看深度學習 現場機器口譯是有可能的93F 09/29 00:17
推 kcl0801: 我覺得還是有差 GOOGLE是在追求唯一解 但是翻譯這種東西每個人翻起來感覺不同 翻譯基本上就是二次創作了 機器只不過是在追求最低限度的正解 但要翻的信雅達 呵呵....
舉一下這兩天微博上傳的例子 簽到處 翻成sign everywhere你說GOOGLE有翻錯嗎?94F 09/29 00:24
推 sellgd: 明明就不到人譯的程度 英中變化差異太大
訓練時要餵資料 中轉英 不是那麼好餵的 要人工餵上數十年99F 09/29 00:42
推 or0706555: 剛剛試著翻譯我的碩論中文摘要,真的翻的比以前好很多(我已經畢業了)101F 09/29 01:00
推 TitanEric: deep learning…八層… 好猛103F 09/29 01:01
推 kria5304: 8層不是8個layer嘛= =? 這算多嗎??104F 09/29 01:31
推 raxtm: 真的有進步了...有點扯,直接翻譯它論文內容
中文讀起來真得有模有樣,在隨便拉一段英文出來有八成以上105F 09/29 01:38
推 or0706555: 目前只能應用在中翻英喔,英翻中還沒使用這個演算法。107F 09/29 02:01
推 PTTLawyer: 樓上 原來如此 我剛剛用英翻中 還是翻出一堆不知所云108F 09/29 02:45
推 newwu: 中翻應真的蠻屌的
快要有翻譯蒟蒻了嗎?109F 09/29 02:45
--