[新聞]DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro - Tech_Job板

作者 pl132 (pl132)
標題 [新聞]DeepSeek-R1 模型升級新版本，推理能力接
時間 Fri May 30 15:47:33 2025

DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro

https://tinyurl.com/2bkshvbp

DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro | TechNews 科技新報 中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。 DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3- ...

中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在
推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。

DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎，在後訓練（
Post-Training）過程投入更多算力，提升新版模型思考深度與推理能力，有助於提升數
學、科學、商業及程式設計等複雜推理任務上的表現。

DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績，並在整
體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。

相較於舊版 DeepSeek-R1，新版模型在複雜推理任務的表現有所提升。例如 AIME 2025
測試，因推理過程中加強思考深度，新版模型準確率由舊版的 70% 提升至 87.5%。

同時，DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT（Chain of Thought）後訓練
Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME

2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B，並與 Qwen3-235B 相當。DeepSeek 認
為，DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆
具意義。

https://is.gd/b5sIbD

與先前版本相同，DeepSeek-R1-0528 採用 MIT 授權條款，並上傳至開源機器學習社群平
台 Hugging Face，開發者能夠自由修改甚至進行商業部署。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.146.20 (臺灣)
※ 作者: pl132 2025-05-30 15:47:33
※ 文章代碼(AID): #1eEMATi2 (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1748591261.A.B02.html

推 lespacino: z,,,，，喔，，我，，,,1F 122.121.26.5 台灣 05/30 16:38

噓 r4989872: 繼續吹吧有open ai根本就不需要這坨2F 101.10.8.231 台灣 05/30 17:03

推 Homeparty: 之前幻覺大概70%，現在大概20%以下4F 101.9.36.148 台灣 05/30 17:28

噓 cityhunter04: 難用的東西，又慢不能問的一堆5F 114.24.105.45 台灣 05/30 17:50

噓 NEWinx: 然後？會畫圖了嗎？6F 1.172.81.21 台灣 05/30 17:50

噓 mercurycgt68: 比人家慢推出性能還沒超過喔不是很秋？7F 114.136.203.135 台灣 05/30 18:17

推 abbei: nobody car 無人車9F 36.228.12.5 台灣 05/30 19:17

推 a731977: MIT我是真的服，META還要自己的LIC10F 101.10.75.231 台灣 05/30 21:31

推 s213092921: http://i.imgur.com/JbgdyHM.jpg11F 223.138.41.35 台灣 05/30 21:37

噓 inunoya: 難用12F 111.249.204.150 台灣 05/30 22:16

→ wbw: 896413F 114.136.131.216 台灣 05/30 22:23

推 CoNsTaR: 這裡的風向和 reddit 也差太多
現在的風向不是 deepseek 才是真正的 open ai，open ai 應該叫 closed ai 嗎14F 111.82.27.182 台灣 05/30 22:35

推 eruption0214: 開源18F 42.75.156.40 台灣 05/30 22:44

推 godog: 70 vs 68 中美AI的差距又縮小了難怪黃說中國AI沒有輸美國一直緊跟在後19F 118.231.161.73 台灣 05/30 22:55

推 havochuman: 風向啥的能吃嗎就問你平常用哪個該不會是deepseek八嘻嘻22F 122.11.212.141 新加坡 05/30 23:10

推 jhjhs33504: 現在開源的都是試玩版不知哪時才能內建在本機系統裡?不然搞得好像韭菜24F 1.162.84.180 台灣 05/30 23:56

噓 fantasyhorse: 使用率這麼低還好意思吹26F 36.225.50.168 台灣 05/31 00:20

→ iPadProPlus: 過氣27F 111.71.213.108 台灣 05/31 01:34

噓 ohohohya: 蒸餾人家永遠無法超車
沒差繼續燒錢就跟電車暴雷一樣28F 111.80.36.174 台灣 05/31 03:43

噓 oboesoul: 台灣只有藍白粉在推..30F 101.10.156.113 台灣 05/31 09:17

噓 gary861226: 樓上言論大可不必31F 101.10.217.214 台灣 05/31 09:24

作者 pl132 的最新發文:

+3 [情報]多款新作延期影響？Ubisoft確認今年不辦自家發表會了 - PlayStation 板

作者: pl132 180.177.2.225 (台灣) 2025-06-05 19:13:30

12F 4推 1噓
+15 [新聞]電馭叛客 2077還有後續DLC？CDPR合作工作 - Steam 板

作者: pl132 180.177.2.225 (台灣) 2025-06-05 12:20:30

36F 18推 3噓
+18 [情報]3A大作《007 曙光初現》實機預告公開，明年登5大平台 - PlayStation 板

作者: pl132 180.177.2.225 (台灣) 2025-06-05 12:16:25

23F 18推
+3 [新聞]全球首款 102.4Tbps 交換器晶片！博通最新 Tomahawk 6 正式出貨 - Tech_Job 板

作者: pl132 180.177.2.225 (台灣) 2025-06-04 21:14:37

14F 3推
- PlayStation 板

作者: pl132 180.177.2.225 (台灣) 2025-06-03 18:35:26

57F 15推 17噓

點此顯示更多發文記錄