[新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Codex 跑分碾壓Opus 4.6 - Stock板

作者 qazxc1156892 (QQ)
標題 [新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Cod
時間 Fri Feb 6 22:25:52 2026

原文標題：緊咬Anthropic！OpenAI同日推GPT-5.3-Codex　跑分碾壓Opus 4.6

原文連結： https://ai.ettoday.net/news/3114219

緊咬Anthropic！OpenAI同日推GPT-5.3-Codex　跑分碾壓Opus 4.6 | ETtoday AI科技 | ETtoday新聞雲

兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Claude Opus 4.6，主打極長文本處理能力；OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex，並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。 ...

發布時間： 2026年02月6日 08:48

記者署名：吳立言

原文內容：

兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Cl
aude Opus 4.6，主打極長文本處理能力；OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex
，並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。

Claude Opus 4.6：導入深度思考機制與多代理協作

Anthropic 此次更新重點聚焦於大規模資訊處理與邏輯穩定性。Claude Opus 4.6 將上下
文視窗（Context Window）擴展至 100 萬 Token，相較於前代版本提升 5 倍之多。技術
層面上，該模型導入了「思考決策點」功能，使模型能辨識問題複雜度，自主決定是否啟
動深度推理流程。

此外，Opus 4.6 強化了多代理（Multi-agent）協作能力，並在長文本記憶留存率上提升
近 4 倍，旨在解決長對話中常見的指令遺忘與邏輯斷層問題，針對大型專案的架構分析
提供了更穩定的基礎。

GPT-5.3-Codex：優化生成效率與 OS 層級操控

面對 Anthropic 的挑戰，OpenAI 推出的 GPT-5.3-Codex 則在編碼基準測試中交出了亮
眼成績。數據顯示，該模型在 SWE-bench Pro（57%）、TerminalBench 2.0（76%）及 O
SWorld（64%）等測試中，皆取得目前業界最高水準。

除了跑分優勢，GPT-5.3-Codex 在開發體驗上有兩項核心突破：

中途干預能力（Mid-task Steerability）：支持任務執行過程中的即時引導與動態更新
，大幅降低複雜開發任務的錯誤成本。

效能密度提升：生成相同內容所需 Token 數降至 5.2-Codex 的一半以下，且每 Token
生成速率提升超過 25%，顯著優化了推理成本與延遲。

這兩款模型的發布顯示出兩家公司發展策略的差異化：Claude 傾向於成為具備超長記憶
與深度邏輯的「數位大腦」；而 GPT-5.3-Codex 則朝向具備系統操作能力、高效率且可
高度受控的「執行工具」進化。

隨著 GPT-5.3-Codex 正式上線，開發者將有機會直接對比這兩款頂尖模型在實際工作流
中的表現差異。

心得/評論：

Google Gemini表示：.......

現在AI變成跟智慧型手機一樣比跑分了

這兩款token都一下子就用完了

Open醬看起來真的急了

以前是領頭羊現在被追趕著不擠牙膏了

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.178.34 (臺灣)
※ 作者: qazxc1156892 2026-02-06 22:25:52
※ 文章代碼(AID): #1fXVdoLi (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1770387954.A.56C.html

推 devidevi: 跑分是啥鬼東西1F 02/06 22:27

推 iwcuforever: 每個月輪流測不同工具，目前來說還真的各有各優點2F 02/06 22:27

推 gladopo: 最近open醬的更新看來不錯，急了3F 02/06 22:27

推 b2060027830: google 下去4F 02/06 22:28

→ iwcuforever: Gemini強在多模態和notebooklm生簡報，Claude生出的文本就是比較嚴謹和有邏輯性，Chatgpt感覺就中庸版本5F 02/06 22:30

推 kanehhh: 哪個模型能降低記憶體的需求就是利多8F 02/06 22:37

推 yousking: 歐噴醬最近中文很強，給股票分析模型還會有（噴爆）等字眼....9F 02/06 22:38

推 jackychen122: Gemini寫程式跟老頑固博士生一樣，不停不做就是不做11F 02/06 22:40

推 offstage: 搞不好被餵進了PTT股板當學習資料12F 02/06 22:41

推 George72: 緊咬是落後者的動詞13F 02/06 22:45

→ csgowen: 寫程式還是喜歡claude14F 02/06 22:47

→ LimYoHwan: 手機用戶通常主力一隻，寫程式很多人是claude, codex, gemini三個都打開來用好嗎
Claude, codex左右互搏，gemini負責ui設計15F 02/06 22:48

推 Toge: 其實我覺得codex寫code略強一點，但Claude很適合當老師18F 02/06 22:50

→ LimYoHwan: 看新聞說claude比較強的人一看就知道沒用真的用過，就算5.2都不輸20F 02/06 22:52

推 pt993526: Gpt目前速度有感提升22F 02/06 22:53

推 tarcowang: openAI是不是有派臥底啊？23F 02/06 22:53

推 sova0809: 這兩個打架受傷的是其他軟體公司24F 02/06 22:53

→ jjjj222: 看我跑分, 好像之前安卓機出來會說的話25F 02/06 22:55

推 Toge: codex一口氣寫出想要的功能機率比較高26F 02/06 22:55

推 Faker0613: 說codex比較屌是沒用過claude code+skills喔幹根本屌打codex27F 02/06 23:05

→ redbeanbread: 擠牙膏喔人家出你才出29F 02/06 23:06

推 tsubasawolfy: Codex 5.3抓bug能力有嚇到。講了一下某步驟的數字跟原始資料有落差而已，他就開始順著開著文檔內的位址一個script爬過一個檢查。然後要求系統權限開始對每個步驟模擬進行跟除錯。最後跟你說是哪個地方有問題，問你要不要修正。修完後還說我順便幫你其他關聯的script都修改好了。30F 02/06 23:09

推 strlen: 這次發表的都是專門寫程式的跑分不用看了都垃圾
codex之前就蠻強的只是速度真的太慢了
這次明顯把短板改進速度提升許多就還不錯了
現在codex基本能與opus並駕其驅甚至部份超越
opus價格太貴了也是劣勢就是了
然後前兩天codex也出了寫程式專用的App 那個讚
CLI就留給那些臭酸老肥宅跟裝逼仔用
電腦發明都幾年了還在回去弄CLI 低能到有剩
另外skills基本就是脫褲子放屁跟MCP一樣遲早過氣skills底層就是提示詞工程最後全都會整合進LLM裡還在那邊玩skills 都是過渡期在用的廢物功能36F 02/06 23:10

→ LimYoHwan: https://i.mopix.cc/iEUpK8.jpg
https://i.mopix.cc/qJhqIf.jpg47F 02/06 23:18

→ LimYoHwan: https://i.mopix.cc/VcT2vs.jpg
Openclaw作者都這樣說了推文的你真的有用過？
https://i.mopix.cc/31W7EU.jpg49F 02/06 23:18

→ strlen: 現在模型進步太快有人不是每天刷推特不曉得不是他52F 02/06 23:22

→ LimYoHwan: 現在就華爾街帶風向說openai不行跟去年講goog一樣的套路故意打壓股價53F 02/06 23:22

→ strlen: 的錯他的印象還留在寫程式=claude
Openclaw作者一開始也是只用claude 後來交叉使用才自己比較出優劣55F 02/06 23:22

→ jjjj222: 讓我想起了vim還是emacs還是vscode比較好的討論..在此預言, 不會有結論....58F 02/06 23:24

→ strlen: 我以前碰過幾個vim死忠仔共同特徵就是又老又肥脾氣陰陽怪氣甚至其中一個連git都不會用只用小烏龜
裝逼仔＋老肥宅無一例外
不會進步的工程師在傳產一待就是20年 20年如一日這就是CLI愛好者的形象60F 02/06 23:25

→ LimYoHwan: Coding用很兇的人，全部都會用啦，各有優缺點，但體感，codex最強，只是速度慢。並不像車子一樣，大部分人選一種品牌65F 02/06 23:27

→ strlen: 不過就無聊抬槓在軟缸板講這個就是大爆炸然後被桶68F 02/06 23:27

推 Serisu: 現在寫程式就在比拼工具練了，誰還在拿模型互比69F 02/06 23:28

→ strlen: 本來就是交叉使用但我最近有點懶的主力就codex就好 claude太貴了啦用沒幾次額度就沒了三洨
當然要互比像Gemini就是垃圾我說寫程式70F 02/06 23:28

→ Serisu: 規格丟上去就等收割了，到底有啥額度問題73F 02/06 23:29

→ strlen: 寫程式SOTA就是codex claude 沒了
其它都是浪費時間時間就是金錢74F 02/06 23:29

→ LimYoHwan: 華爾街現在吹gemini 一狗票人也認為goog很強，開始要被套了76F 02/06 23:30

→ strlen: 當然gemini強項本來就在生圖之類的可理解啦
狗家也有投資Antropic 大概是一個打消費一個打企業說好要聯合把歐噴醬幹死二打一
巨頭血戰連續劇讓窩們繼續看下去78F 02/06 23:31

→ m30127813: 離線ai值得期待嗎？82F 02/06 23:33

作者 qazxc1156892 的最新發文:

+6 [新聞] 陳宗彥腦溢血二度手術賴清德今私下探視 - Gossiping 板

作者: qazxc1156892 223.137.178.34 (台灣) 2026-02-06 23:08:55

38F 14推 8噓
+18 [新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Codex 跑分碾壓Opus 4.6 - Stock 板

作者: qazxc1156892 223.137.178.34 (台灣) 2026-02-06 22:25:52

82F 18推
+9 [問卦] 女生說她有一根仙女棒是什麼意思？ - Gossiping 板

作者: qazxc1156892 223.137.178.34 (台灣) 2026-02-06 21:16:21

16F 10推 1噓
+11 [問卦] 美股怎麼又崩了？ - Gossiping 板

作者: qazxc1156892 223.137.178.34 (台灣) 2026-02-06 00:05:47

31F 13推 2噓
+10 [情報] 瑞昱開獎 - Tech_Job 板

作者: qazxc1156892 223.137.178.34 (台灣) 2026-02-05 22:06:28

32F 13推 3噓

點此顯示更多發文記錄