看板 Gossiping作者 jackliao1990 (jack)標題 [爆卦] DeepMind開發的AlphaFold解決了高懸48年時間 Tue Dec 1 15:46:44 2020
https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-gran
d-challenge-in-biology
Christian B. Anfinsen在1972年諾貝爾化學獎的獲獎感言中提出了一個假設:理論上蛋
白質的氨基酸序列應該完全決定其結構。這個假設顯示我們用1維氨基酸序列就能預測蛋
白質3維結構。
然而蛋白質在進入3維結構前,理論上可折疊方式的數量是天文數字,用暴力計算來列舉
一種蛋白質的所有可能結構需要的時間比宇宙的年齡還長。
DeepMind公司為此開發了AlphaFold 2,用來解開蛋白質折疊問題-其複雜度比解決圍棋
問題的AlphaGo(複雜度10^171)高出129個數量級。這個AI一直以來受到"先射箭後畫靶"
的作弊質疑,因此DeepMind決定接受馬克斯普朗克研究所蛋白質進化學系主任Andrei L
upas提出的挑戰:預測古細菌的膜蛋白。
十年來科學家雖然獲取了這個蛋白質的X光數據,但是一直無法理解它。AlphaFold 2輸
出了該蛋白質詳細圖像後,科學家用半小時進行驗證,實驗結果完全符合AlphaFold的預
測。
AlphaFold 2系統的訓練方式如下:研究員把折疊蛋白質認作是一個空間圖,殘基是節點
,邊緣連接著非常接近的殘基。之後建立一個基於注意力機制的神經網路系統,並進行
端到端訓練。
AI會試圖解釋這個圖的結構,同時對它構建的隱式圖進行推理。這個推理過程還會用到
生物學已知的知識進行完善(Ex.同源序列,多序列比對,氨基酸殘基對)。AlphaFold還使
用了內部可靠度指標來判斷結構中哪些部分是可靠的。重複這過程,該系統能在幾天內
確定正確結構。
研究員還在擁有17萬個蛋白質結構的數據庫上訓練AI。訓練進行了幾週的時間,使用大
約128個TPUv3內核(相當於100-200個GPU)。
AlphaFold 2的GDT(蛋白質結構預測的評估標準)平均得分為92.4,這表示誤差不超過一
個原子大小,計算生物學家John Moult說:"某種意義上,蛋白質折疊問題已經解決了。
"
哈薩比斯表示:"DeepMind背後的終極願景一直是構建通用AI,利用通用AI來極大地加速
科學發現的步伐,幫助我們更好地了解周圍世界。"
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.15.77 (臺灣)
※ 文章代碼(AID): #1VnVJhzf (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1606808811.A.F69.html
→ vowpool: 蛋白質摺疊要幹嘛? 會比較好吃嗎10F 12/01 15:48
推 Colantoni: 啊這不是我在樓梯間遇到隔壁阿婆隨口聊天的內容嗎14F 12/01 15:49
→ STi2011: 恩恩 你終於進步了 我很欣慰17F 12/01 15:50
推 bengowa: 恩恩 跟我想的差不多嘛19F 12/01 15:51
推 applebg: 台灣生科的環境,懂得人應該不多吧24F 12/01 15:53
推 ECZEMA: 給病毒胺基酸序列 可以決定三維空間結構了 生化武器大突破28F 12/01 15:55
推 Irenicus: 這超屌 如果每次預測都準的話以後蛋白質結構都不用做了新藥(新病毒)開發的速度可以快上好幾倍29F 12/01 15:55
推 good5755: 其實這應該算是資工領域 跟生物關聯性不大33F 12/01 15:56
推 Vedfolnir: 這樣還有需要folding@home嗎34F 12/01 15:57
推 btaro: 這在生物領域算核彈級的突破36F 12/01 15:58
推 james80351: 我用1050ti訓練一分鐘就得到結果 Deepmind太弱了吧(X)38F 12/01 16:00
推 izual: 人類能逃的時間越來越少了...可怕42F 12/01 16:03
推 ro991010: 簡而言之就是.. 算了 懂的都懂43F 12/01 16:03
推 Busufu: 我大便都能算出來 這還需要寫ai?45F 12/01 16:04
推 NLstyle: 比阿發狗的問題複雜度高129個數量級是什麼鬼46F 12/01 16:05
推 satllion: 這是生物資訊,蠻好奇TPUv3價格多少,感覺不是一般實驗51F 12/01 16:10
推 zaqimon: 阿發狗什麼時候可以跟我說明天哪支股票會漲停52F 12/01 16:10
→ satllion: 室負擔得起,不過他已經有訓練好的模型,能夠開放給大家使用那就好了53F 12/01 16:10
噓 dslite: 那也是用猜的 沒有golden data56F 12/01 16:12
→ daye2012: 我論文就這樣寫啊,教授看不懂還罵我58F 12/01 16:14
推 abadjoke: 這個已經是能從一次元資訊回推三次元資訊了 太扯60F 12/01 16:16
推 TomChu: 好像很厲害?63F 12/01 16:18
推 s505015: 沒有很厲害 因為這是很久的技術65F 12/01 16:18
→ james80351: 看官網定價TPUv3:$1752/month nVidia V100:$540/month66F 12/01 16:18
推 kevabc1: AlphaFold is skynet67F 12/01 16:18
→ james80351: 月租的v3還是8核而已 實驗是128核所以再乘16倍?68F 12/01 16:22
推 boss74123: 我早就知道qi會這樣做
ai 啦幹 該死自動選字70F 12/01 16:23
→ WWIII: 不頒諾貝爾獎給ai?74F 12/01 16:27
推 kobala: 我之前就一直講了 沒人要信77F 12/01 16:31
推 flyqoo: 嗯,和我想的一樣84F 12/01 16:50
推 tikowm: 跟我想的差不多85F 12/01 16:50
推 sealdoom: 會得諾貝爾獎 蛋白質工程的通通要失業了88F 12/01 16:53
推 oyaji5566: 這個我在costco買乳清蛋白的時候有想到,結帳就忘了89F 12/01 16:56
推 aimgel: 剛在拉死的時候驗算了一下 AI表現不錯喔91F 12/01 17:00
推 lugiam: AI繼續發展下去 人類就差不多要進入知識奇異點了93F 12/01 17:02
推 AoWsL: 下個人類毀滅的病毒是被電腦製造出來的,不太意外94F 12/01 17:03
推 spirit119: 不就我昨天睡前想到的東西嗎 這樣也能上新聞喔95F 12/01 17:06
推 EKman: 阿發狗:書呆子來打星海啦96F 12/01 17:11
推 whhw: 恩恩105F 12/01 17:42
推 kinomon: 開始覺得有點噁了106F 12/01 17:46
推 NomadShu: 靠杯,這是聖杯等級的issue耶107F 12/01 17:48
推 will331: 計算生物學家可以洗洗睡了109F 12/01 17:53
推 newest: 這個很重要,可以解狂牛病跟老人癡呆111F 12/01 17:54
推 saedn: 好可怕 這可叫暴力拆解嗎?112F 12/01 17:55
推 wiork: 有人能翻譯嗎....114F 12/01 17:56
推 broken119: 我輸了 我誤差兩個原子 輸的心服口服116F 12/01 17:57
推 dg0704: 現在是attention is all you need的世界了117F 12/01 18:01
推 rXIN: 這很狂==119F 12/01 18:11
→ diawboris: 生科起飛個鬼阿 本來就要念一堆賺不到錢的書了 現在還要學著用ML 崩潰好嗎122F 12/01 18:22
推 kiy75: 蛋白質工程可以進入下一步了124F 12/01 18:24
→ sanpf: 嗯嗯,跟我想得差不多125F 12/01 18:25
推 dffrew: 知道結構就能知道功能和運作方式,對生化反應和藥物設計126F 12/01 18:26
推 wmh1109: 嗯,比我厲害,我目前只能下圍棋贏AlphaGo127F 12/01 18:27
推 dffrew: 來說都很重要128F 12/01 18:30
→ mystage: 知道蛋白質如何折疊,就能預測性質。這也是AI被期待解決的重大問題之一。全世界的科技發展停滯了許久,終於有望迎來新一波加速。AI搭配量子電腦134F 12/01 19:00
推 yujchen: 這個真的厲害,但研究上光知道折法是不夠的
能快速做出預測,但後面要驗證的東西還是很多138F 12/01 19:16
推 pig0038: 狂...下一步就是倒推基因序列了,何時會有調整者142F 12/01 19:29
噓 quinietos: 第二段還不是看賓州教授的論文推導的 沒創意143F 12/01 19:30
推 tkufc: 這個人是不是撿到我的筆記==145F 12/01 19:38
推 jajypn: 嗯嗯 我就知道是這樣..148F 12/01 20:01
→ lairx: 我也這麼覺得149F 12/01 20:04
推 robocon: 我每天跑的folding@home可以停了?151F 12/01 20:10
推 deathsman: 我當初就是電腦等級太差才算到現在 不然就是我發表的152F 12/01 20:19
推 headiron: 恩恩, 我也是這樣覺得, 現在終於成功了153F 12/01 20:30
→ Suboy: 嗯本來就是這樣的160F 12/01 21:43
→ JoeyChen: 靠 人類的生化技術是不是要進入新的階段了161F 12/01 21:46
→ webster1112: 人類透過AI又接近上帝一大步了 應該說我們要當上帝了162F 12/01 21:51
推 Bonjwa: 我小學就解決了165F 12/01 22:30
→ FTICR: F@H直接改去算AI可能比算力學模擬有用了167F 12/01 23:43
推 dnek: 太神奇了吧,所以我說那個人型電腦什麼時候才要問世168F 12/01 23:57
推 hodj: 跟我想的一樣170F 12/02 00:03
推 Nauglamir: 怎麼一直有人問折疊是甚麼,連結裡面有影片說明啊172F 12/02 00:12
推 aneshsiao: 蛋白質結構預測的評估標準)平均得分為92.4,這表示誤差不超過一個原子大小,這是什麼意思?
人類跟AI比起來像個智障175F 12/02 09:32
推 Jerry08957: 不超過一個原子 應是指平均不超過 所以部份完全符合部份推測完全符合 有些還是有幾個誤差179F 12/02 11:03
--