[新聞] OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度 - Gossiping板

作者 KotoriCute (乙醯胺酚)
標題 [新聞] OpenAI的實驗性模型能力已達國際數學奧
時間 Tue Jul 22 00:31:53 2025

備註請放最後面違者新聞文章刪除

1.媒體來源:
※ 例如蘋果日報、自由時報（請參考版規下方的核准媒體名單）
※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許
iThome

2.記者署名:
※ 若新聞沒有記者名字或編輯名字，請勿張貼，否則會被水桶14天
※ 外電至少要有來源或編輯如:法新社
陳曉莉

3.完整新聞標題:
※ 標題沒有完整寫出來 ---> 依照板規刪除文章
OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度

4.完整新聞內文:
※ 社論特稿都不能貼！違者刪除（政治類水桶3個月)，貼廣告也會被刪除喔！可詳看版規

OpenAI的研究科學家Alexander Wei上周六（7/19）宣布，OpenAI實驗性的推理大型語言模
型在世界最負盛名的數學競賽—國際數學奧林匹亞（International Math Olympiad，IMO）
取得了金牌等級的成績。Wei在X上展示了一張草苺掛上金牌的照片，外界猜測或許代表其專
案名稱為Strawberry。

IMO是一項針對高中生的全球性數學競賽，在兩天的競賽中各提供4.5小時的時間來解決涵蓋
不同領域的3道數學題目，每道題最高為7分，金牌門檻每年不一，通常落在31~42分之間，
今年數奧甫於上周結束，金牌門檻為35分，有67名同學獲得金牌。OpenAI採用與人類參賽者
同樣的規則，不使用工具或網路，讓模型閱讀官方問題的陳述，再以自然語言撰寫證明，它
解決了5道題目，得到35分，剛好為今年的金牌門檻。

Google DeepMind的AlphaProof模型也曾在2024年挑戰數奧，它解決了4道題目，得到28分，
距去年金牌門檻只有1分之遙。

Wei說，相較於過去的基準測試，IMO需要持續的思考能力，此一結果意味著模型的推理時間
範圍，已從只需要0.1分鐘的GSM8K、約1分鐘的MATH、10分鐘的AIME，擴展至可能需要100分
鐘的IMO，從簡單的快速運算到處理需要長時間思考的複雜問題，同時媲美人類頂尖數學家
。

此外，除了結果本身，Wei更對他們所使用的方法感到興奮，因為他們並非透過狹隘、針對
特定任務的方法，而是在通用強化學習及推理時擴充運算能力上開創了新局面。

不過，該達到數奧金牌等級的大型語言模型仍只是個實驗性的研究模型，並非商業產品，Op
enAI短期內、至少在數個月內都不會釋出類似的功能。但外界可以期待的是OpenAI即將發表
GPT-5。

該模型很可能是Wei在OpenAI的最後一個作品，因為專注於大型語言模型及推理研究的Wei已
於今年7月中跳槽至Meta AI，成為Meta超級智慧實驗室（Meta Superintelligence Labs，M
SL）的一員。

5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:
※ 當新聞連結過長時，需提供短網址方便網友點擊
https://www.ithome.com.tw/news/170164

OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度 | iThome

根據OpenAI研究科學家的說法，OpenAI實驗性推理LLM的數學能力，已經與國際數學奧林匹亞金牌選手相當 ...

6.備註:
※ 一個人一天只能張貼一則新聞(以天為單位)，被刪或自刪也算額度內，超貼者水桶，請?
※ 備註請勿張貼三日內新聞(包含連結、標題等)

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.83.31 (臺灣)
※ 作者: KotoriCute 2025-07-22 00:31:53
※ 文章代碼(AID): #1eVcjxu2 (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753115515.A.E02.html

推 qwop5: 台灣缺電不用跟人玩1F 42.73.171.203 台灣 07/22 01:26

→ yunf: 那是因為你們的小腦袋太天真了
你蓋一座別人可以蓋100座
只要是考量體能贏的都沒有必要去硬拚
靠*
到時候真的完成他甚至可以把算力中心丟到外太空
算完把結果傳回來就好
你現在東西會壞是因為他是消費性電子他也可以做一個不會壞的2F 101.10.157.170 台灣 07/22 02:31

作者 KotoriCute 的最新發文:

+1 [新聞] OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度 - Gossiping 板

作者: KotoriCute 114.38.83.31 (台灣) 2025-07-22 00:31:53

10F 1推
+48 [M.D.] 禁卡表公布後才合成的卡不再給分解加成 - YUGIOH 板

作者: KotoriCute 111.82.205.143 (台灣) 2025-07-18 15:04:05

173F 48推
+83 [新聞] 逢甲「皇家蛋糕」被掏空208萬！老闆悲憤輕生二審逆轉：西點師將入監 - Gossiping 板

作者: KotoriCute 61.224.144.111 (台灣) 2025-07-18 09:10:54

台中逢甲商圈知名蛋糕店「皇家蛋糕」在地經營30多年，深受顧客喜愛，不料去（113）年5 月卻陸續爆出勞資糾紛、食安問題，事後店家傳出歇業。原來有名朝姓西點師傅5年來利用職務之便偷取店內原物料，轉賣 …

212F 92推 9噓
+10 - Gossiping 板

作者: KotoriCute 114.38.100.212 (台灣) 2025-07-16 20:55:40

20F 11推 1噓
+5 [討論] TCG有1301無DBJH環境的NAWCQ比賽上位 - YUGIOH 板

作者: KotoriCute 114.38.100.212 (台灣) 2025-07-14 11:07:09

12F 5推

點此顯示更多發文記錄