作者 freeunixer (離自相空她相)標題 Re: [問卦] DeepSeek V4是不是屌爆了啊?時間 Thu Apr 30 04:45:28 2026
※ 引述《sxy67230 (charlesgg)》之銘言:
: 有沒有DeepSeek V4屌爆的拔掛啊?
我這兩天在想要怎麼講 DeepSeek V4 對於中國的意義與價值,
但實際上,這個進展,不只是 DeepSeek,還包括華為、Kimi
DeepSeek:
1.V4 用 FP8+FP4(MoE) 訓練
2.CSV + HBA 暴力壓縮 KV Cache 耗用
3.降低每次啟動參數量
4.MoE 的通訊與計算切更細,改寫算子,做到精度對齊,
在 NV 及華為上可跑出相同的數學結果
達到 unbinding CUDA,使內文視窗可達到 1M tokens
以上,在為以下鋪路
華為:
1.CANN 在 DeekSeek 的支持下有了代表實績可以對抗 CUDA
所以,只需要用華為 950PR 的 NPU(推理用),就能滿足用戶使用,因此
2.950PR 從四月開始到明年,會是 NV 以外,最搶手的中國 LLM 卡.
DeepSeek 破壞性價格,也源自於推理使用時的硬體成本降低(不需 H200 或更高).
Kimi:
1.Prefill-as-a-Service
在 DeepSeek,已經對 KV Cache 的節省做到暴力的降低,
Kimi 做到 KV Cache 的 Prefill 與 Decode 的 Decoupling,
可以讓 Prefill(高算需求) 與 Decode(快速反應)跨節點、跨機房甚至跨低區傳輸,
不再必備 400G 以上的 RDMA,在 100G 的乙太網路,就可運作.
(實測在 20G 以內即可滿足基本使用需求)
並透過切分快取類型 prefix 與 transfer,再提高 cache 利用率及降低頻寬耗用.
在美系 O、G、A、M 全陷入 GPU 缺, token 費用開始暴漲,跟 N 家內鬨混戰的時候,
中系廠商用 做黑手 的硬幹方式,繼續向其他人展現不輕易向國際土匪低頭的韌性 (~誤
--
※ 編輯: freeunixer (60.250.90.238 臺灣), 04/30/2026 04:50:04
推 error405: 別變戰略武器的話都很好1F 114.36.240.115 台灣 04/30 05:01
推 zelkova: 美國用AI當作戰略武器時就不見有些人放屁笑死2F 207.161.49.22 加拿大 04/30 05:14
推 ilyj2012: 好專業!4F 172.59.215.32 美國 04/30 05:22
推 splendidpoem: 這就是之前巨頭們反對封鎖中國的原因:對中國實施硬體封鎖,讓他們無法跟美系巨頭一起燒錢打軍備競賽,反而逼迫他們走向了降本增效的另一條路。5F 111.249.216.237 台灣 04/30 05:23
推 Borey: 推+1樓上10F 114.25.183.236 台灣 04/30 05:29
推 adems77: 太專業了~11F 39.14.176.186 台灣 04/30 05:29
推 yoluyolu: 就我覺得 看問題來問歐美人還是華人 回答角度可能都會不同 而AI確實也不用怕卷 有市場區隔就可以 但是如果連基本功能都要收錢 那當然會被卷爆12F 223.137.149.127 台灣 04/30 05:33
--
※ 同主題文章:
Re: [問卦] DeepSeek V4是不是屌爆了啊?
04-30 04:45 freeunixer