顯示廣告
隱藏 ✕
※ 本文為 lecheck 轉寄自 ptt.cc 更新時間: 2026-04-30 05:30:15
看板 Gossiping
作者 freeunixer (離自相空她相)
標題 Re: [問卦] DeepSeek V4是不是屌爆了啊?
時間 Thu Apr 30 04:45:28 2026


※ 引述《sxy67230 (charlesgg)》之銘言:
: 有沒有DeepSeek V4屌爆的拔掛啊?

我這兩天在想要怎麼講 DeepSeek V4 對於中國的意義與價值,
但實際上,這個進展,不只是 DeepSeek,還包括華為、Kimi

DeepSeek:

1.V4 用 FP8+FP4(MoE) 訓練

2.CSV + HBA 暴力壓縮 KV Cache 耗用

3.降低每次啟動參數量

4.MoE 的通訊與計算切更細,改寫算子,做到精度對齊,
  在 NV 及華為上可跑出相同的數學結果

達到 unbinding CUDA,使內文視窗可達到 1M tokens

以上,在為以下鋪路

華為:

1.CANN 在 DeekSeek 的支持下有了代表實績可以對抗 CUDA

所以,只需要用華為 950PR 的 NPU(推理用),就能滿足用戶使用,因此

2.950PR 從四月開始到明年,會是 NV 以外,最搶手的中國 LLM 卡.

DeepSeek 破壞性價格,也源自於推理使用時的硬體成本降低(不需 H200 或更高).

Kimi:

1.Prefill-as-a-Service
  在 DeepSeek,已經對 KV Cache 的節省做到暴力的降低,
  Kimi 做到 KV Cache 的 Prefill 與 Decode 的 Decoupling,
  可以讓 Prefill(高算需求) 與 Decode(快速反應)跨節點、跨機房甚至跨低區傳輸,
  不再必備 400G 以上的 RDMA,在 100G 的乙太網路,就可運作.
  (實測在 20G 以內即可滿足基本使用需求)
  並透過切分快取類型 prefix 與 transfer,再提高 cache 利用率及降低頻寬耗用.

在美系 O、G、A、M 全陷入 GPU 缺, token 費用開始暴漲,跟 N 家內鬨混戰的時候,

中系廠商用 做黑手 的硬幹方式,繼續向其他人展現不輕易向國際土匪低頭的韌性 (~誤


--
※ 編輯: freeunixer (60.250.90.238 臺灣), 04/30/2026 04:50:04
error405: 別變戰略武器的話都很好1F 114.36.240.115 台灣 04/30 05:01
zelkova: 美國用AI當作戰略武器時就不見有些人放屁2F 207.161.49.22 加拿大 04/30 05:14
zelkova: 笑死
ilyj2012: 好專業!4F 172.59.215.32 美國 04/30 05:22
splendidpoem: 這就是之前巨頭們反對封鎖中國的原5F 111.249.216.237 台灣 04/30 05:23
splendidpoem: 因:對中國實施硬體封鎖,讓他們無
splendidpoem: 法跟美系巨頭一起燒錢打軍備競賽,
splendidpoem: 反而逼迫他們走向了降本增效的另一
splendidpoem: 條路。

--
※ 看板: whatla 文章推薦值: 0 目前人氣: 0 累積人氣: 10 
作者 freeunixer 的最新發文:
點此顯示更多發文記錄
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇