作者 winall (winall)標題 [新聞] 新模型 R2 延後主因!DeepSeek 嘗試華為時間 Thu Aug 14 23:55:25 2025
新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA
科技新報 作者 林妤柔 2025年08月14日 15:22
https://tinyurl.com/24gqjw6w
中國人工智慧(AI)公司
DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,
延後新一代
模型的發布,這也凸顯北京推動取代美國技術的困難。
知情人士透露,
DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,
改採用華為昇騰(
Ascend)處理器,而非 NVIDIA 系統。
然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進
行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,
這是模型發布從 5
月延後的主要原因,導致 DeepSeek 在競爭中落後。
所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或
產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導
體自給自足所面臨的挑戰。
外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提
供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。
業界人士認為,
與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢,
以及軟體水準較差等劣勢。
據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2
模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek
與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。
知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時
間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新
模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。
加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在
經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不
代表未來不會發生。這只是時間問題」。
心得/評論:
今天這個新聞很多
用Google搜尋了一下,一堆 https://ibb.co/Rp38wm4T
中國最近以為自己又長大了,開始抓 Nvidia H20 問題
其實如果你了解中國,大部分都是政治問題,不是H20有問題
H20最多就一個定位系統 主要在抓H20是不是出現在不合理的地方 追蹤買家
說H20有後門 我只能說是天大笑話
真正有後門的產品都是中國的產品
H20不可能有後門,中國的說法是政治說法
以為自己長大了 其實還是幼稚園
現在終於爆出 DeepSeek 用華為昇騰訓練不出來==> 真是笑死
然後前一陣子 我看到一個消息
中國在吹 華為昇騰384超節點 超越 Nvidia了
中國把這個吹上天,你們自己去查,我看了也是大笑
你們有興趣的人自己去搜尋,吹上天了 真可笑
https://tinyurl.com/2bjjcc7n
如果華為這麼行
Nvidia 股價早就崩了
中國這種吹牛的習性 沿至於自卑
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.200.151 (臺灣)
※ 作者: winall 2025-08-14 23:55:25
※ 文章代碼(AID): #1edWRoXU (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1755186930.A.85E.html
※ 編輯: winall (114.24.200.151 臺灣), 08/14/2025 23:58:55
噓 ep301177: 有在看中國社群就知道,開始在洗黃仁勳是中國人,讓中國民眾接受買NV了3F 08/15 00:12
推 mainsa: 我還以為華為那個就吹好玩的 沒想到中國真的有公司5F 08/15 00:13
→ mainsa: 會去用那種東西 說起來也是很愛國了7F 08/15 00:14
→ mp32283228: 阿哈哈哈 不是說DS很厲害中國晶片很厲害 你看看你8F 08/15 00:15
推 ntr203: 所以ds到底是不是用nv的低階晶片?9F 08/15 00:17
噓 jinkela1: 真正有後門都中國產品?你要不要去對德國Angela
Merkel講10F 08/15 00:17
推 s213092921: 「根據聯博投信 (Bernstein) 預測,輝達在中國的 AI 晶片市佔率將從 2024 年的 66% 下滑至今年的 55%」,這些市占跑去哪裡好難猜啊12F 08/15 00:25
推 holysong: 中國政府為什麼要封鎖特斯拉?因為他們也這樣要求中國電動車15F 08/15 00:25
推 shiki1988: 吹完這個繼續吹比亞迪 不意外
中吹的邏輯大概都是17F 08/15 00:31
推 g0t24568: 難怪中國政府要出來喊 不然華為ai晶片整個掛19F 08/15 00:45
推 eriker: 用華為真的是愛國人士 沒有各種方便的cuda跟torch支援 純手刻的世界20F 08/15 00:49
→ CAFEHu: 亞馬孫核心怪盜:口嫌體正值22F 08/15 00:50
推 rahit: 有些模型有為昇騰等中國晶片特別調整
但排標配還是N家gpu
在AI的世界N卡目前是Windows的地位23F 08/15 01:03
→ HiuAnOP: 科技日報不可信!什麼野雞雜誌?26F 08/15 01:10
→ newwu: 應該是對自己的手刻能力很有信心吧
畢竟之前就去改Cuda 更底層的code加速,結果還是太難了28F 08/15 01:21
推 ariadne: 昇騰384最奇葩是體積超大,號稱媲美NVL72。結果NV一個機櫃,昇騰384要16個機櫃才能媲美,還是常當機跑不完自瀆式的媲美。佔地跟耗能明顯遙遙領先的多31F 08/15 01:31
→ qwe78971: 繞不開cuda 來什麼晶片都一樣34F 08/15 02:00
推 lPla: 中國或成最大贏家37F 08/15 02:58
推 mopa: 技術壁壘那麼容易突破,就不會有今天的輝達了38F 08/15 06:18
--