作者 KotoriCute (乙醯胺酚)標題 [新聞] OpenAI的實驗性模型能力已達國際數學奧時間 Tue Jul 22 00:31:53 2025
備註請放最後面 違者新聞文章刪除
1.媒體來源:
※ 例如蘋果日報、自由時報(請參考版規下方的核准媒體名單)
※ Yahoo、MSN、LINE等非直接官方新聞連結不被允許
iThome
2.記者署名:
※ 若新聞沒有記者名字或編輯名字,請勿張貼,否則會被水桶14天
※ 外電至少要有來源或編輯 如:法新社
陳曉莉
3.完整新聞標題:
※ 標題沒有完整寫出來 ---> 依照板規刪除文章
OpenAI的實驗性模型能力已達國際數學奧林匹亞金牌選手程度
4.完整新聞內文:
※ 社論特稿都不能貼!違者刪除(政治類水桶3個月),貼廣告也會被刪除喔!可詳看版規
OpenAI的研究科學家Alexander Wei上周六(7/19)宣布,OpenAI實驗性的推理大型語言模
型在世界最負盛名的數學競賽—國際數學奧林匹亞(International Math Olympiad,IMO)
取得了金牌等級的成績。Wei在X上展示了一張草苺掛上金牌的照片,外界猜測或許代表其專
案名稱為Strawberry。
IMO是一項針對高中生的全球性數學競賽,在兩天的競賽中各提供4.5小時的時間來解決涵蓋
不同領域的3道數學題目,每道題最高為7分,金牌門檻每年不一,通常落在31~42分之間,
今年數奧甫於上周結束,金牌門檻為35分,有67名同學獲得金牌。OpenAI採用與人類參賽者
同樣的規則,不使用工具或網路,讓模型閱讀官方問題的陳述,再以自然語言撰寫證明,它
解決了5道題目,得到35分,剛好為今年的金牌門檻。
Google DeepMind的AlphaProof模型也曾在2024年挑戰數奧,它解決了4道題目,得到28分,
距去年金牌門檻只有1分之遙。
Wei說,相較於過去的基準測試,IMO需要持續的思考能力,此一結果意味著模型的推理時間
範圍,已從只需要0.1分鐘的GSM8K、約1分鐘的MATH、10分鐘的AIME,擴展至可能需要100分
鐘的IMO,從簡單的快速運算到處理需要長時間思考的複雜問題,同時媲美人類頂尖數學家
。
此外,除了結果本身,Wei更對他們所使用的方法感到興奮,因為他們並非透過狹隘、針對
特定任務的方法,而是在通用強化學習及推理時擴充運算能力上開創了新局面。
不過,該達到數奧金牌等級的大型語言模型仍只是個實驗性的研究模型,並非商業產品,Op
enAI短期內、至少在數個月內都不會釋出類似的功能。但外界可以期待的是OpenAI即將發表
GPT-5。
該模型很可能是Wei在OpenAI的最後一個作品,因為專注於大型語言模型及推理研究的Wei已
於今年7月中跳槽至Meta AI,成為Meta超級智慧實驗室(Meta Superintelligence Labs,M
SL)的一員。
5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:
※ 當新聞連結過長時,需提供短網址方便網友點擊
https://www.ithome.com.tw/news/170164
6.備註:
※ 一個人一天只能張貼一則新聞(以天為單位),被刪或自刪也算額度內,超貼者水桶,請?
※ 備註請勿張貼三日內新聞(包含連結、標題等)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.83.31 (臺灣)
※ 作者: KotoriCute 2025-07-22 00:31:53
※ 文章代碼(AID): #1eVcjxu2 (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753115515.A.E02.html
推 qwop5: 台灣缺電 不用跟人玩1F 42.73.171.203 台灣 07/22 01:26
→ yunf: 那是因為你們的小腦袋太天真了
你蓋一座 別人可以蓋100座
只要是考量體能贏的都沒有必要去硬拚
靠*
到時候真的完成 他甚至可以把算力中心丟到外太空
算完把結果傳回來就好
你現在東西會壞是因為他是消費性電子 他也可以做一個不會壞的2F 101.10.157.170 台灣 07/22 02:31
--