顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2016-09-29 09:06:15
看板 Gossiping
作者 IN (願自身光明熾然照耀世界)
標題 [新聞] Google發布類神經機器翻譯 翻譯品質接近
時間 Wed Sep 28 22:41:32 2016


Google發布類神經機器翻譯 翻譯品質接近筆譯人員

TechFeed 科技讀報 2016-09-28

Google於昨日發布了網頁版和行動版的Google翻譯。在中翻英的過程中,會採用全新的類
神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,Google針對這個
翻譯系統的運作原理,發表了一篇學術論文。


之前,Google就曾表示它們在Google翻譯中運用了類神經網路技術,但只限於即時視覺翻
譯這個功能。前段時間,Google的資深員工Jeff Dean曾告訴VentureBeat,Google已經在
嘗試把越來越多的深度學習功能融入到Google翻譯中。除此之外,Google的一位發言人在
郵件中說,最新的類神經機器翻譯是他們努力研發深度學習功能的成果。


實際上,Google一直以來都在致力於將深度類神經網路融入它旗下越來越多的應用軟體中
,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助Google更快捷、更有效地
處理它們的數據。


Google的類神經機器翻譯(GNMT)對八層長的短時記憶遞歸類神經網路(LSTM-RNNs)依
賴性很強。 “通過層間殘留聯繫可以加強梯度流。”Google科學家在論文中寫道。在影
像處理器的幫助下,類神經網路一旦變得足夠成熟,Google就可以靠它尚未發布的張量處
理單元進行數據處理。


雖然類神經機器翻譯並不永遠是最佳之選,但是Google的各種嘗試顯示,在某些情況下它
還是有過人之處的。

https://techfeed.today/wp-content/uploads/2016/09/57eb0b92f38de.png.jpeg
[圖]
 

“人們對這個翻譯系統的評價顯示,比起之前基於短語的翻譯系統,在翻譯多種語言時,
類神經學習翻譯系統的錯誤率已經降低了60%,其中包括英法互譯,英西互譯以及英中互
譯。附加實驗的結果顯示,翻譯系統的品質將和筆譯人員平均水準更加接近。”


在昨天發表的一篇文章中,Google Brain Team的研發科學家Quoc Le 和Mike Schuster提
到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,Google類神經機器翻
譯的錯誤率實際上已經降低了55%到85%。


儘管如此,這個系統還是不完美的。 “類神經機器翻譯還是會犯一些筆譯人員永遠都不
可能犯的錯誤,比如漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章
語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,類神經機
器翻譯具有里程碑意義。”


新聞連結: http://tinyurl.com/j9h6qjb
Google發布類神經機器翻譯,翻譯品質接近筆譯人員 - TechFeed科技讀報
[圖]
Google於昨日發布了網頁版和行動版的Google翻譯。在中翻英的過程中,會採用全新的類神經機器翻譯,而這個App每天要進行一千八百萬次這樣的翻譯。此外,Google針對這個翻譯系統的運作原理,發表了一篇學術論文。之前,Google就曾表示它們在Google翻譯中運用了類神經網路技術,但只限於即時 ...

 

Google論文原文: http://arxiv.org/abs/1609.08144

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.130.168.122
※ 文章代碼(AID): #1NwzQeQV (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1475073704.A.69F.html
idolater: 又有人要失業了1F 09/28 22:42
kuninaka: 其實背後是3DM大媽2F 09/28 22:42
w3160828: 翻譯人才要被機器人取代了3F 09/28 22:42
SRNOB: 阿兩傑作4F 09/28 22:42
oijkue: may sure gun more5F 09/28 22:42
avgirl: 還是依樣爛6F 09/28 22:43
alog: 沒關係 google小姐還不會實況 跟不會翻譯動畫7F 09/28 22:43
a77942002: 騙我沒用過google翻譯~8F 09/28 22:43
gt069802: 又有人力被取代9F 09/28 22:43
a1091100075: 看來我要失業了......10F 09/28 22:43
itmyshit: 3DM(笑11F 09/28 22:43
sinohara: 尖銳12F 09/28 22:43
rookiecop: 會中翻英嗎?13F 09/28 22:43
oncemore: error要低於專業翻譯還有很長一段路要走14F 09/28 22:43
adi5566: 以後遊戲內建翻譯15F 09/28 22:43
a1091100075: 不過地球人口真的過剩了 多點科技發展淘汰掉些沒必要16F 09/28 22:44
agong: 情慾流動 Lust flow17F 09/28 22:44
sellgd: 已超越Bing translator了嗎18F 09/28 22:44
freshbanana: 翻譯組會失業嗎19F 09/28 22:44
followwar: GOOGLE最近一篇wavenet可以製造出接近人類發聲的語音20F 09/28 22:44
a1091100075: 的人口也是好事 恭禧理組啊21F 09/28 22:44
ImBBCALL: 失業個屁 在等20年吧22F 09/28 22:44
w3160828: 可能不用五年吧23F 09/28 22:45
freshbanana: 釣到一個翻譯組的24F 09/28 22:45
a1091100075: 以後口譯人員也沒必要了 帶台智慧型手機就好25F 09/28 22:45
shadeel: 不會再出現烘手機(bake cell phone)這種東西了吧26F 09/28 22:45
followwar: 深度學習出現到超越人類的圖形辨識能力只花了4年27F 09/28 22:46
sellgd: 如果超越Bing translator 我才會怕一些些28F 09/28 22:46
tomer: 類神經啊 ...阿發GO幫翻譯的意思嗎29F 09/28 22:46
w3160828: 他末段出現的錯誤 現在一堆翻譯人員也長出包 至少贏台灣30F 09/28 22:46
sellgd: 英中互譯還有一段時間,歐語之間才比較要先怕31F 09/28 22:46
sellgd: GNMT的網址和以前Google translate一樣嗎
kuninaka: 洪蘭的書丟給這個會不會比較好33F 09/28 22:47
ironkyoater: 其實是中川和麗子在後面翻譯34F 09/28 22:47
a1091100075: 還好 等中譯英達到人所翻的品質時 我大概也差不多噶35F 09/28 22:48
typecommand: 已經可以超越人類的圖形辨識能力了?36F 09/28 22:48
oldlu2002: 至少比洪蘭好37F 09/28 22:48
a1091100075: 屁了 以後唸外文的就自己小心點啦38F 09/28 22:48
ev331: 那如果大家都看的懂中英日語咧 你會不會怕39F 09/28 22:49
w3160828: 現在已經贏過台灣人翻譯了 雖然是出版社用人問題40F 09/28 22:49
greg7575: 注音文怎麼翻41F 09/28 22:49
QQDK: 所以說理組立國 文組誤國 在任何時代都適用啊42F 09/28 22:50
ev331: 立個屁東西 立到自己都被革掉43F 09/28 22:51
netio: 看成Google發神經44F 09/28 22:51
ev331: 沒人就變機器共國國了45F 09/28 22:52
fyer: 不用學英語了46F 09/28 22:52
ev331:            共和國了47F 09/28 22:52
ev331: 不學會變笨哦
DrTech: RNN + LSTM 翻譯還蠻常見的阿49F 09/28 22:52
ev331: 今天有基因改造人的新聞50F 09/28 22:52
ev331: 基改人 不遠啦
DrTech: 不過用了8層倒是第一次看到。52F 09/28 22:53
ev331: 枱面上都這樣了 私底下不知道有沒有人偷偷做了53F 09/28 22:53
BBQ2591: 跟我想的一樣 就是類神經系統嘛54F 09/28 22:55
bill0205: 先學會如何100%完整詮釋英翻中 中翻英55F 09/28 22:56
ev331: 反正就是死不到自己沒關係的概念56F 09/28 22:56
amaki: http://arxiv.org/pdf/1609.08144v1.pdf   論文在此57F 09/28 22:57
storyo11413: 語言變化很小的完整翻譯只是遲早問題 太公式化58F 09/28 22:57
amaki: 這玩意超威的,翻譯領域、外文等科系幾乎等於被判死刑...59F 09/28 22:58
menshuei: 有個東西就是太口語的東西無法翻,另有些拼音語言常常60F 09/28 22:59
menshuei: 使用簡寫,但是機器還未有考量的到這一點。
jay3u7218: 文組的又要倒霉了62F 09/28 22:59
amaki: Google還刻意第一時間選擇arXiv平台發表論文63F 09/28 22:59
typecommand: 我比較想看到可以即時翻譯中日文,這樣ptt-2ch合併,64F 09/28 23:00
typecommand: 一定很有趣
akway: 就是阿發狗那套技術拿來用 這下翻譯真的會gg66F 09/28 23:00
xinyuxiao: 快點在我唸書時出!!!67F 09/28 23:02
loking: 口語的也可以翻阿 training時餵進去就好了68F 09/28 23:04
willion003: 慘,69F 09/28 23:04
amaki: 我如果是外文科系學生或工作人員,現在就會開始瘋狂找後路70F 09/28 23:06
oherman: 應該比洪蘭翻譯強1000倍71F 09/28 23:09
teiai: 翻譯翻譯什麼叫他媽的驚喜72F 09/28 23:14
orze04: 有種去翻日文73F 09/28 23:24
ksxo: 以後可以拿來和洪比看看了74F 09/28 23:28
discoveryray: 外文系22k確定75F 09/28 23:29
BIGETC: 股溝好邪惡RRR76F 09/28 23:29
a23529886: 所以app的載點在哪?77F 09/28 23:30
waiter337: 我覺得要分成好幾種個性來區分比較好78F 09/28 23:32
stella323: 如果可以未來直接植入人腦大家不久各種語言都會79F 09/28 23:32
waiter337: 向鄉民的翻譯方向 官員的翻譯方向書本的翻譯方向80F 09/28 23:33
waiter337: 如果要改變情緒 要傳遞給另一台情緒翻譯才可以翻完
mithuang: 理組又害文組少一種工作了...82F 09/28 23:36
orze04: 隨便抓一篇論文就一堆翻錯或不順zzzzz83F 09/28 23:36
cvop720: 機翻依然是垃圾84F 09/28 23:39
jackie0804: 繼續加油85F 09/28 23:52
zzzz8931: 深度學習耶...86F 09/28 23:53
sinaviva: 以後就讀原文小說就好啦  現在好像也是87F 09/28 23:55
davidrockcom: 文組這種東西就是要來管理組的88F 09/29 00:11
a1qazbgt5: 人腦就是神經原為零件組成的機器  人做得到事的沒理由89F 09/29 00:11
a1qazbgt5: 機器不行
davidrockcom: 而理組這種東西就是要消滅文組的91F 09/29 00:11
tony70017: 以下開放文組開炮92F 09/29 00:16
lyu0001: 別小看深度學習  現場機器口譯是有可能的93F 09/29 00:17
kcl0801: 我覺得還是有差 GOOGLE是在追求唯一解 但是翻譯這種東西94F 09/29 00:24
kcl0801: 每個人翻起來感覺不同 翻譯基本上就是二次創作了 機器只
kcl0801: 不過是在追求最低限度的正解 但要翻的信雅達 呵呵....
kcl0801: 舉一下這兩天微博上傳的例子 簽到處 翻成sign everywhere
kcl0801: 你說GOOGLE有翻錯嗎?
sellgd: 明明就不到人譯的程度 英中變化差異太大99F 09/29 00:42
sellgd: 訓練時要餵資料 中轉英 不是那麼好餵的 要人工餵上數十年
or0706555: 剛剛試著翻譯我的碩論中文摘要,真的翻的比以前好很多101F 09/29 01:00
or0706555: (我已經畢業了)
TitanEric: deep learning…八層… 好猛103F 09/29 01:01
kria5304: 8層不是8個layer嘛= =? 這算多嗎??104F 09/29 01:31
raxtm: 真的有進步了...有點扯,直接翻譯它論文內容105F 09/29 01:38
raxtm: 中文讀起來真得有模有樣,在隨便拉一段英文出來有八成以上
or0706555: 目前只能應用在中翻英喔,英翻中還沒使用這個演算法。107F 09/29 02:01
PTTLawyer: 樓上 原來如此 我剛剛用英翻中 還是翻出一堆不知所云108F 09/29 02:45
newwu: 中翻應真的蠻屌的109F 09/29 02:45
newwu: 快要有翻譯蒟蒻了嗎?
junseimika: 真的翻得很好..111F 09/29 08:33

--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 2036 
作者 IN 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
1樓 時間: 2016-09-29 09:10:10 (台灣)
  09-29 09:10 TW
比起三口相聲真的好多了
2樓 時間: 2016-09-29 11:04:34 (台灣)
+1 09-29 11:04 TW
之前看手機上的CNN新聞翻譯 就感覺蠻準的
新聞稿那種文字嚴謹度 翻譯上的錯誤就比較少的感覺
3樓 時間: 2016-09-29 11:28:13 (台灣)
  09-29 11:28 TW
文組XDDDDDDDDDDDD
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇