作者 swh922 (不如總在途中)標題 Re: [問卦] DeepSeek V4 為什麼這次影響這麼大?時間 Sat May 2 00:57:05 2026
※ 引述 《humbler (獸人H)》 之銘言:
: 標題: [問卦] DeepSeek V4 為什麼這次影響這麼大?
: 時間: Fri May 1 23:57:34 2026
:
: DeepSeek V4在幾天前問世
: 但是這次這個模型
: 卻引發美國政壇和科技圈的大震撼
: 美國國務院說中國剽竊美國
: 科技業也很震撼
: 因為這個開源模型
: 僅次於Gemini
: 但是成本比美國AI模型便宜97%
:
:
DeepSeek-V4系列對美國同行的壓力主要體現在三個方面
1、打破Nvidia的壟斷地位
衆所周知,CUDA是Nvidia最大的技術護城河,全世界的AI大模型幾乎都在依賴它進行模型的
開發和訓練,DeepSeek-v4是第一個擺脫對Nvidia依賴的AI大模型,它適配國產的華為晟騰A
scend 950系列芯片和CANN生態,這是黃仁勳之前一再警告最不樂見的結果
2、極致的性價比
GPT-5.5的輸出價格是DeepSeek-v4-pro的8.6倍,是DeepSeek-V4-flash的輸出價格的107倍
,這種極致的性價比直接讓目前最火的openclaw(俗稱「小龍蝦」)直接將DeepSeek-v4-fl
ash設置為了其默認模型,等下半年Ascend 950大規模量產並部署後,價格還會進一步下降
,AI大模型的token也將迎來白菜價
3、一如既往的開源
DeepSeek的開源吸引了大量技術開發者參與其中,之前日本本土樂天的AI模型就是基於deep
seek-v3的開源項目專門優化的,而且開源也讓很多企業用戶可以自己部署模型,這等於間
接侵蝕了美國那些閉源模型的潛在市場份額
以上
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 104.28.152.174 (美國)
※ 作者: swh922 2026-05-02 00:57:05
※ 文章代碼(AID): #1fzDja3z (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1777654628.A.0FD.html
※ 同主題文章:
Re: [問卦] DeepSeek V4 為什麼這次影響這麼大?
05-02 00:57 swh922
→ pooznn: 華為產量才多少?!新增算力 美國1/10都不到1F 111.240.14.82 台灣 05/02 00:59
華為的晟騰950芯片雖然弱於輝達的H200,但是憑藉其超節點技術可以組成超大集群,彌補
單卡在性能上的不足,而且中國也不缺電力,下半年計劃出貨約75萬片Ascend 950PR
→ scarbywind: gemini連gpu都沒用 誰才擺脫cuda2F 220.132.56.3 台灣 05/02 01:06
※ 編輯: swh922 (104.28.152.174 美國), 05/02/2026 01:07:40
→ pooznn: 你要不要去查一下NV 今年訂單是幾百萬片?!3F 111.240.14.82 台灣 05/02 01:11
輝達的芯片是賣給全世界,華為的目前只賣給國內幾家AI公司用,中美各有各的優勢,算力
當然還是美國遙遙領先,但是美國缺電很嚴重,Meta和google都被逼得自己建發電廠了,中
國的國產DUV已經量產了,芯片產量早晚會上去,AI模型的token也早晚會變白菜價,讓我們
拭目以待吧
→ pooznn: 新晶片的算力 比H200 強多少?!4F 111.240.14.82 台灣 05/02 01:12
→ tenka92417: 把投資額算進去才有1/10的差距吧5F 114.44.45.247 台灣 05/02 01:12
推 tetani: 把token價格打下來 逼其他家降價6F 218.173.197.210 台灣 05/02 01:13
推 nfsong: ASIC 特化的矩陣運算晶片
比通用的H200 強
看看聯發科 這一個月股價翻倍 的速度
google 不是開玩笑的
新的MOE 專家模型 , 啟用率不到10%7F 114.24.125.106 台灣 05/02 01:13
→ pooznn: 巨頭 當然有本錢可以自己畫ASIC 其它 小咖短時間內 還是只能靠NV的CUDA12F 111.240.14.82 台灣 05/02 01:16
→ nfsong: 運算量 又是指數下降
天下武功 唯快不破
MoE 專家模型 MLA 記憶壓縮
4月初 消息外洩 4/16 論文發表
4/19 OpenMythos 就上線了
可以想像 最前緣的人 開多少agent在跑14F 114.24.125.106 台灣 05/02 01:17
※ 編輯: swh922 (104.28.166.44 美國), 05/02/2026 01:24:32
推 s213092921: 青鳥還在比較單晶片算力效能,人家早就上千卡串聯了,遙遙領先20F 220.138.100.233 台灣 05/02 01:25
→ nfsong: Nicholas Carlini (Anthropic 研究員)
開16個Agents , 一個月幹出c語言編譯氣
10萬行代碼 , 以前要好幾百人才能開發
Dario Amodei 這裡拜說Anthropic 的程式22F 114.24.125.106 台灣 05/02 01:30
→ alex01: 真的笑死26F 223.137.2.188 台灣 05/02 01:34
→ nfsong: 現在是Claude agents 寫的
程序員 就是看輸出的代碼27F 114.24.125.106 台灣 05/02 01:34
→ pooznn: 你公司也要給你預算 才能燒Token29F 111.240.14.82 台灣 05/02 01:35
→ nfsong: 你看 幾個出來分享的大頭 都是有錢公司啊Spotify
Notion
John Carmack
Peter Steinberger30F 114.24.125.106 台灣 05/02 01:36
噓 a1252352: 上次的鬼故事已經成為考古題了35F 27.240.43.215 台灣 05/02 01:38
這次deepseek-v4最大的變化是擺脫了對輝達芯片和CUDA生態的依賴,還有,不要小瞧中國A
I模型開源的影響力,Hugging Face上中國開源模型月下載占比已達 41%(超越美國的36.5%
),OpenRouter 等聚合平台,今年初,中國模型 Token 调用量首次超過美國,前五大模型
中有四款來自中國,占比一度達85%以上
推 nfsong: AI自我修正的能力 比人類開發強多了
有完整的MLOps 生命週期 (MLflow)36F 114.24.125.106 台灣 05/02 01:43
※ 編輯: swh922 (104.28.152.174 美國), 05/02/2026 01:44:21
→ nfsong: 可以Trace 看哪裡錯了
是資料檢索錯了?還是模型推理偏了?
調用工具時參數傳錯了?38F 114.24.125.106 台灣 05/02 01:44
→ xixixxiixxii: 美國以為不賣中國顯卡可以卡住中國AI發展,沒想到讓中國自幹出用自家產品的AI。美國少賺顯卡的錢,又讓AI領先地位受到威脅,美國又贏了2次41F 111.242.210.141 台灣 05/02 01:57
→ pooznn: 台積電產能排到後年去了 然後你跟我說少賺45F 111.240.14.82 台灣 05/02 02:12
推 lulululula: 狗家模型都是用TPU練的 早就突破cuda框架了46F 101.10.2.87 台灣 05/02 02:59
推 Supasizeit: 阿共很多還是模擬cuda吧48F 203.204.195.174 台灣 05/02 04:13
推 splendidpoem: 青鳥真的搞不清楚狀況。
一直拿單卡算力說嘴,但DeepSeek v4 + Ascend令人震驚的點從來不是它的算力超強,而是它在不依賴美國GPU下,同等算力的訓練和布署成本超低。
工業革命時,瓦特的蒸汽機並不是當時效能最強的,而是同等效能下的低成本,讓機器得以全面普及。LCD和電漿競爭時,獲勝的不是畫質超強的電漿,而是低成本,在尺寸上又方便大量布署的LCD。
不只黃仁勳,ASML、英特爾、博通等大廠都警告過了:封鎖中國技術,只會讓中國取得全自主化的能力。49F 49.218.240.215 台灣 05/02 07:41
推 horse2819: 中吹 還在啊64F 1.168.98.27 台灣 05/02 07:56
--