看板 Gossiping作者 Cyuhsuan (姆斯沒去過強隊)標題 [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英時間 Thu Mar 15 10:32:52 2018
1.媒體來源:
iThome
2.完整新聞標題:
機器翻譯大突破!微軟加入新方法,AI中翻英程度達人類專業水準
3.完整新聞內文:
微軟AI研究團隊近日於官方的部落格中表示,微軟的AI機器翻譯系統可以將中文的新聞文章翻譯成英文,透過雙語專業人員評估,AI機器翻譯系統的表現與人類相當,微軟表示,中文和英文有較充足的詞彙資料庫,透過新聞的常見詞彙搭配深度學習演算法,再加入新方法模仿人類翻譯的流程,不斷地調整,讓機器翻譯系統產出的結果更加準確。
特別的是,微軟的研究團隊在AI機器翻譯系統中,加入雙重學習(Dual learning)的機制,也就是說,系統將中文的新聞文章翻成英文後,會再將英文的翻譯結果翻成中文,重新比對兩者的相似性,並讓系統從錯誤中學習。除此之外,該AI機器翻譯系統還加入了審議網路(Deliberation network),系統會學習研究員翻譯句子的過程,模擬人類一次次編修文字的過程。
而為了確保翻譯結果的準確性,微軟加入聯合訓練方法(Joint training),透過中翻英和英翻中2個系統交互學習,英翻中的系統可以提供新的中文句子,與原文的中文句子形成一組資料集,增加訓練集的資料量,中翻英也是如此,將2個系統互相學習時,即可以改善各自的準確率。
另外,微軟也嘗試採用一致性正規化(Agreement regularization)的方法來加強翻譯結果的準確性,簡單來說,AI機器翻譯系統從左到右,或是從右到左閱讀語句,翻譯出來的結果必須一致,微軟相信,系統若產生相同的翻譯結果,是比較準確的。
在微軟負責語音、自然語言和機器翻譯的技術團隊成員Xuedong Huang表示,這項成果是自然語言處理任務中,非常重要的里程碑,機器翻譯達到人類的水準一直是團隊的目標,他表示,沒想到這麼快就能實現。
過去幾十年來,機器翻譯一直是研究員想要解決的問題之一,許多語言專家也認為機器翻譯不可能達到人類的水準,這項成果雖然是重要的里程碑,但是不代表機器翻譯的問題已經解決,微軟亞洲研究院副院長周明表示,還有許多挑戰和問題,像是在即時新聞上測試機器翻譯系統,他期待,這項成果可以應用在不同的語言,甚至是不同的AI研究領域中。
4.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/121818
5.備註:
翻譯人員是否要失業了?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.251.62.253
※ 文章代碼(AID): #1QgTjNbW (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1521081175.A.960.html
※ 同主題文章:
[新聞] 機器翻譯大突破!微軟加入新方法AI中翻英
03-15 10:32 Cyuhsuan.
推 kent: 簡體中文會不會很多翻譯不了的語詞2F 03/15 10:33
→ kamisun: 大概10年後會有一般對話能用的口語翻譯機出現4F 03/15 10:34
推 kinghtt: 上一個會學習的AI後來被調教成酸民5F 03/15 10:34
推 phix: 太好了8F 03/15 10:34
→ intela60474: vvvi 人家這還在實驗室 你用bing是在搞笑嗎21F 03/15 10:39
推 naihr: 不會翻譯成水平跟質量這兩個中國用語,讚24F 03/15 10:39
推 bg00004: 希望人類以後不需要再為了語言不通所煩惱27F 03/15 10:40
→ AAQQUUAA: 可以不用在書店洪蘭翻譯的東西是好事啊29F 03/15 10:40
推 Strasburg: 整句翻譯一直是AI的天缺 我覺得甚至可以當圖靈測驗XD30F 03/15 10:41
推 Mahasata: 合理 本來語言翻譯就可以大程度被科技取代 但有限就是31F 03/15 10:41
推 biaw: 原本就已經比google翻譯好了32F 03/15 10:42
→ KangSuat …
推 KangSuat: 不管啦! 口譯不會被取代!34F 03/15 10:42
推 schopan: 比google好多了 我剛剛試高堂明鏡悲白髮 朝如青絲暮成雪37F 03/15 10:43
→ zero09107: 未來學外文會被笑嗎 直接買翻譯器就好38F 03/15 10:44
噓 Jin63916: 新聞和廣告年年看到,實品卻神龍見首不見尾39F 03/15 10:44
推 liaon98: 好了 鄉民不用煩惱官方語言改英文了40F 03/15 10:46
推 hiramyaya: 叫它翻譯 send lee tree pay42F 03/15 10:49
推 tomzakeru: 雖然太深的無法翻譯但基本文章都可以翻的話也很夠用了至少英文不行的人來說是救星阿43F 03/15 10:52
推 jhangyu: 應該還沒有實際放到他們的翻譯服務裡面46F 03/15 10:55
推 sellgd: 還是需要人工修稿啦
去年Google的品質超越BING50F 03/15 11:01
噓 hackfox: 豪洨的成分比較大,就算google也是翻的226652F 03/15 11:03
→ sellgd: 歐語之間取代性很高 詞序一樣的對譯 但最終還是需要人工修Google去年發表的成果真的很強 二層關係詞子句 很不錯
三層還常常正確53F 03/15 11:03
推 xsexyx: 可以直接放棄學習各國語言嗎56F 03/15 11:04
→ sellgd: 但細微之處還是得人工修57F 03/15 11:04
推 yuinghoooo: 不可能吧、人都翻譯不好了,機器的話也就幾句還能看59F 03/15 11:05
推 sellgd: 不過這種工具真的能大幅加速譯者的流程 光一整段查單字就.60F 03/15 11:07
推 smmoon: 人類只需要一種語言61F 03/15 11:07
推 zero00072: 英文、中文都是 SVO 且不分陰陽,比起歐語算蛋糕了。62F 03/15 11:20
推 zone0016: 中英文邏輯差太多了,其實很難翻66F 03/15 11:29
推 assai000: 翻單詞誤差很大 但是翻整句意思還滿準的67F 03/15 11:32
推 reppoc: 翻幾篇ptt廢文來看看68F 03/15 11:39
推 notneme159: 在還不能隨時隨地的即席翻譯 口譯就不會失業70F 03/15 11:55
→ WWIII: 文組 QQ 快來學程式轉職當碼農吧72F 03/15 12:19
推 lyu0001: youtube自動翻譯英文 就讓很多翻譯失業了吧73F 03/15 12:37
推 sscck5: 沒標準沒規則xddd 想嗆你文組 但看來連文組都不如 看來應該是管院的74F 03/15 12:46
噓 Ayenyen: 文組崩潰wwwwwww78F 03/15 13:03
推 s655131: 以前也有人說電腦圍棋贏不了人 ...反正文組一定要看到自82F 03/15 19:17
推 peiring: 翻譯米糕大概再20年出現83F 03/15 19:17
→ s655131: 己被科技打臉才敢承認84F 03/15 19:17
推 DarkerDuck: 有些文組還在糾結在沒規則沒規律XDD
這些語感的問題只是不容易寫成規則,不是完全沒規則真的完全沒規則的東西,人腦也是學不起來的
傳統機械翻譯會失敗就是想要把所有語法規則都寫成程式現在機械學習就是不跟電腦講了,你自己用大數據去學87F 03/15 19:36
推 cometfr: 能日翻中才是最強的,翻譯出來沒一句像人話93F 03/15 20:18
→ followwar: deep learning又在虐人類了94F 03/15 20:31
推 rahit: 中英暫時不會
母語簡單的就要小心了95F 03/15 20:31
推 sellgd: 我自己會一些程設 有些程式的專用巨集都會寫 英譯中
規則沒那麼容易定義完全
不信把這篇的web版丟Google翻譯看看97F 03/15 20:32
--