[情報] Grok答不出柏德之門3問題馬斯克怒凍結模型更新 - C_Chat板

作者 Winux (Windows X Linux)
標題 [情報] Grok答不出柏德之門3問題馬斯克怒凍結模型更新
時間 Fri Feb 27 21:40:26 2026

Grok 答不出〈柏德之門 3〉問題，馬斯克怒凍模型更新、抽調工程師緊急救火T

https://reurl.cc/vKyevN

Grok 答不出〈柏德之門 3〉問題，馬斯克怒凍模型更新、抽調工程師緊急救火 | TechNews 科技新報 伊隆‧馬斯克（Elon Musk）旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答〈柏德之門〉（Baldur’s Gate）遊戲細節問題，延遲數天推出模型更新。xAI 更緊急抽調多名高級工程師放下手頭項目，專門協助改善 Grok 遊戲知識庫。工程師臨時被抽調遊戲問題觸發內部 ...

伊隆‧馬斯克（Elon Musk）旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答
〈柏德之門〉（Baldur’s Gate）遊戲細節問題，延遲數天推出模型更新。xAI 更緊急抽
調多名高級工程師放下手頭項目，專門協助改善 Grok 遊戲知識庫。

工程師臨時被抽調遊戲問題觸發內部混亂

Business Insider 深度調查報導披露，Elon Musk 對 Grok 回答〈柏德之門 3〉（

Baldur’s Gate 3）細節問題表現強烈不滿，下令延遲推出相關模型更新。他要求高級工
程師放下手頭項目，轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶
如無休止消防演習。xAI 位於帕羅奧圖（Palo Alto）總部設有多個作戰室，隨時應對各
種緊急情況。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok

在〈英雄聯盟〉（League of Legends）遊戲能力，目標更是達到最高挑戰者（
Challenger）段位。

Larian Studios 開發〈柏德之門 3〉，以龍與地下城（Dungeons & Dragons）為背景。
遊戲劇情複雜且機制豐富，廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考，
業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。

Grok 成績大翻身準確率現達 92%

事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報
導，Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名，
向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結
果顯示 Grok 整體勝任，準確率據報達 92%。

四大 AI 風格各異

測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料，並
大量使用 save-scumming 及 DPS 等玩家術語，不熟悉遊戲用戶較難理解。ChatGPT 傾向
以重點列表簡潔作答。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎，建
議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識，回答風格差異比內
容差異更為明顯。

這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求，最
終讓 Grok 遊戲知識領域能力得到大幅提升。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.145.120 (臺灣)
※ 作者: Winux 2026-02-27 21:40:26
※ 文章代碼(AID): #1fePxDSG (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1772199629.A.710.html

※ 編輯: Winux (61.224.145.120 臺灣), 02/27/2026 21:40:50

推 error405: 之後就是說要讓grok去打電競了1F 02/27 21:43

推 guogu: 內部管理混亂(X 上頭腦門一拍想啥做啥(O
回答遊戲內問題很重要嗎== 今天馬投顧關心柏德之門
明天他玩了其他遊戲發現有錯又要工程師改嗎
這就像馬投顧他的推特觸及率下降去電工程師一樣2F 02/27 21:43

推 error405: 沒人用grok幹正事那專注娛樂用途也好6F 02/27 21:46

→ guogu: 從那之後我的為你推薦時不時就會出現他的推文
靠北我平常根本就不看英文推文! 我推特就是看圖而已7F 02/27 21:46

推 shigurew: 如果他能在所有電玩知識領域大幅超越其他AI那會挺有趣的有任何電玩問題就問grok，這樣也不錯9F 02/27 21:47

→ XZXie: 這麼嚴格11F 02/27 21:48

推 bladesinger: 重點是馬投顧要求改善的可否一法通萬法通12F 02/27 21:48

→ aaronhkg: 電玩攻略問AI要答對不難啊抓特定網站資料就行13F 02/27 21:49

推 error405: 真正有用的應該是實際打電玩能力能夠練綜合智商14F 02/27 21:50

推 attacksoil: 笑死那我可以問他SB最佳兼職策略嗎15F 02/27 21:50

推 kopune: 希望也能加強偶像大師的正確率別在偶大和LL和Hololive
都搞混了16F 02/27 21:51

推 Amulet1: 笑鼠18F 02/27 21:51

→ ssarc: 能不能報個明牌讓我知道台股哪隻成本最低又漲的最高19F 02/27 21:53

推 e446582284: 柏德3說實話很考驗AI統整能力，設定超細一堆支線，攻略區一把抓很容易出錯20F 02/27 21:54

推 kaj1983: 被老闆抓到bug了，不改不行啊XD22F 02/27 21:56

推 GAOTT: 能不能先搞瑟瑟23F 02/27 21:56

推 Xration: 重點XAi要轉軍用這點程度不能不會吧24F 02/27 21:56

推 johnny3: 因為這個在網路上能找到精準答案這都回答不好表示很爛25F 02/27 21:57

→ aaronhkg: 只要抓BG3 Wiki的資料基本上就解答了會出錯就是抓到討論區的白痴AI26F 02/27 21:57

→ Israfil: AI明顯在有很多登場人物的作品都會搞錯他不是搞錯身高幾公分幾歲這種細節問題而是在大部份資料都正確的情況下冷28F 02/27 21:59

推 qaz630210: grok生成色圖被閹割，連翻譯av字幕都比gemini差，價格還比較貴，完全沒訂閱的理由了30F 02/27 22:00

→ Israfil: 不及防給你來一個對作品內容都不太深入的人都不會犯的錯而且中文名和翻譯名居然是分開的有可能會發生原文譯名正32F 02/27 22:02

推 guogu: 翻譯圖片內容目前gemini應該是最強的34F 02/27 22:04

→ Israfil: 確但中文譯名錯誤的情形若非親眼看到窩直覺也是怎麼可能35F 02/27 22:04

→ guogu: 在B站上不少那種假錯視圖測試幾乎都只有gemini能過36F 02/27 22:05

→ GAOTT: 能不能先搞瑟瑟37F 02/27 22:05

→ winda6627: 至少敢承認不能回答BG3問題的AI就是垃圾。38F 02/27 22:07

→ poke001: 笑死39F 02/27 22:17

推 ruby080808: 上次我記得板上有人用ai問中國法律，也是錯很大，但想不起來是那一家的ai==40F 02/27 22:19

→ t77133562003: 能正確答才有問題吧... 資料去那邊幹來的42F 02/27 22:39

作者 Winux 的最新發文:

+5 [情報] Hololive Dreams 的內建語言 - C_Chat 板

作者: Winux 61.224.168.116 (台灣) 2026-04-15 20:11:45

15F 6推 1噓
+10 [邦邦] 悲報邦邦演唱會重回中國 - C_Chat 板

作者: Winux 111.83.17.138 (台灣) 2026-04-15 17:41:26

18F 10推
+22 [情報] 駭客公開GTAOL營收和各平台貢獻比例 - C_Chat 板

作者: Winux 111.83.17.138 (台灣) 2026-04-15 16:32:26

RDOL和GTAOL 從2025/9/9~2026/3/24的收入前十國家的營收總營收234714008鎂各平台貢獻的營收原來PC上的收入比微軟的X1還少 GTA為何沒有PC首發 PC玩家要檢 …

38F 23推 1噓
+26 [公連] 日服平衡性調整灰姑娘真步削弱 - C_Chat 板

作者: Winux 111.83.17.138 (台灣) 2026-04-15 15:05:39

有灰姑娘真步的隊伍在特定情況下，在短時間可以讓灰姑娘真步多次發動UB，導致攻擊力大幅超出預期，產生的過高傷害的情況又是真步本體的6星真步被砍，灰姑娘真步也被砍了 …

72F 26推
+13 [情報] 遊戲王OCG 跳舞的童話小動物小兔兔 - C_Chat 板

作者: Winux 111.83.24.24 (台灣) 2026-04-14 20:08:24

19F 13推

點此顯示更多發文記錄