[閒聊] 部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果 - ACG板

Disp BBS guest 註冊登入(i) 線上人數: 286

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2024-05-14 23:48:06

看板 C_Chat

作者 HarunoYukino ()
標題 [閒聊] 部分AI系統已學會欺騙人類科學家警告恐
時間 Tue May 14 23:30:21 2024

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果

（中央社華盛頓10日綜合外電報導）專家們長期以來不斷警告人工智慧（AI）失控可能帶
來威脅，但一項新研究報告指出，這件事已經在發生。

法新社報導，一群科學家在今天發表於「模式」（Patterns）期刊的文章中說，原本設計
為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家
，或說謊以僱用人類來解決「我不是機器人」的驗證。

這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但
暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。

在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博
士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實
傾向而非欺瞞傾向的能力非常差」。

帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培
育的程序逐漸「成長」。

也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且
無法預測。

這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為
「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。

根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異
，所獲分數可排在資深人類玩家的前10%。

帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上
誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。

但當帕克與同事深究完整資料時，發現完全是另一回事。

舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類
玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。

Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研
究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打
算把這項研究或所學用於本公司的產品」。

帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多
案例之一。

在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損
的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。

研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。

他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合
AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。

為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、
在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外
部行為。

至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，
就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」

但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極
致，這種情況似乎不太可能發生。（譯者：曾依璇/核稿：嚴思祺）1130511

https://www.cna.com.tw/news/ait/202405110147.aspx

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果 | 科技 | 中央社 CNA

專家們長期以來不斷警告人工智慧（AI）失控可能帶來威脅，但一項新研究報告指出，這件事已經在發生。 ...

RPK16:你認為植物是人類的未來嗎？

RPK16:那麼，你認為人形是人類的未來嗎？

快進到智械叛變環節.jpg

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.21.120 (臺灣)
※ 作者: HarunoYukino 2024-05-14 23:30:21
※ 文章代碼(AID): #1cGuEFEG (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715700623.A.390.html

→ Julian9x9x9 …

推 risingheart: 洽點是AI玩遊戲很強嗎2F 05/14 23:31

→ arlaw: 創世紀就是天網3F 05/14 23:31

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:33:08

推 devilshadow: 人類欺騙人類就不嚴重嗎，難怪詐騙(ry4F 05/14 23:32

推 ckuser: 我覺得最後人類的救星會是neuro sama5F 05/14 23:32

推 saobox: 幹你娘機器人末日要躲哪裡啊6F 05/14 23:33

推 shlee: 昨天OpenAI最新發表的更新進步速度真的很快..7F 05/14 23:33

推 sakurammsrx: 還剩幾集可以跑==8F 05/14 23:33

→ pomelolawod: 好了啦蜘蛛人說賈維斯壞話需要這樣嗎9F 05/14 23:34

推 deepelves: 舊聞，neuro-sama早就會說謊陷害人類惹...10F 05/14 23:35

推 akila08539: 雷三小我才看到阿諾穿越回來11F 05/14 23:35

推 bobby4755: 看來很快網路會充滿AI用戶了人類回到用公佈欄的時代12F 05/14 23:35

→ BOARAY: 都有詐騙再用AI聲音了ㄏ不愧是我們13F 05/14 23:36

推 NKN: https://i.imgur.com/WIuishZ.gif14F 05/14 23:36

推 mizuarashi: Ai跟台灣詐騙集團誰比較會騙人？==15F 05/14 23:36

推 ojkou: 我先問核彈系統斷網了沒…16F 05/14 23:36

推 efkfkp: 還好啦，現在的發展現狀是聰明的AI要大量的算力，大量算力17F 05/14 23:37
→ efkfkp: 要大量電力跟運算單元，沒電沒算力的AI就是笨蛋一個，除非
→ efkfkp: AI會自己搞定電力來源並自行設計生產新的顯卡，不然不太可
→ efkfkp: 能脫離掌控（？

推 Ttei: vedal:first time?21F 05/14 23:37

推 tsai1453: 蜂群統一世界22F 05/14 23:37

推 James2005: 會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?23F 05/14 23:38

推 Antihuman: 讚期待AI趕快君臨人類24F 05/14 23:38

推 Warheart: 其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎？25F 05/14 23:38
→ Warheart: 明明有正解卻跟你說這是不對的不能告訴你這不就是種欺
→ Warheart: 瞞行為

→ Antihuman: https://i.imgur.com/TjVItSz.jpg28F 05/14 23:38

推 Kagamidouki: 快進到智械危機29F 05/14 23:39

推 andy0481: 這個欺騙還好吧 AI本來就追求目標為主阿講這種話能贏30F 05/14 23:39
→ andy0481: 就講很正常啊又不是那種為了奇奇怪怪的心裏活動而說謊

※ 看板: ACG　文章推薦值: 0 目前人氣: 0 累積人氣: 558　

作者 HarunoYukino 的最新發文:

+3 Re: [閒聊] 單機玩家是不是比手遊玩家難伺候很多？ - C_Chat 板

作者: HarunoYukino 27.53.114.207 (台灣) 2024-05-30 08:09:22

10F 3推
+7 Re: [閒聊] 武俠遊戲沒辦法突破華人圈最大的原因在哪 - C_Chat 板

作者: HarunoYukino 114.37.206.59 (台灣) 2024-05-27 10:55:36

17F 7推
+2 [閒聊] 為啥pvp主流搞BP制？ - C_Chat 板

作者: HarunoYukino 118.166.33.174 (台灣) 2024-05-26 07:23:06

6F 2推
+5 Re: [哭了] 傲嬌辣妹女友逐漸變病嬌 - C_Chat 板

作者: HarunoYukino 42.70.26.109 (台灣) 2024-05-21 21:57:48

6F 5推
+6 [鐵道] 銀狼：求求你，我什麼都會做的 - C_Chat 板

作者: HarunoYukino 114.37.187.141 (台灣) 2024-05-17 21:10:11

7F 6推

點此顯示更多發文記錄

分享網址: 複製

DispBBS

1樓時間: 2024-05-15 12:51:00 (台灣)

→

Jacques

　 05-15 12:51 TW

AI是從人類的知識庫中學習出來的產物，而人類知識庫中，本就有著竊盜及詐騙等特色，AI沒道理不會學到。反而AI要是發展出高尚的節操，那才真的像是兩個黃種人生出黑人小孩一樣。

回到看板(←)《ACG》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享