Re: [問卦] DeepSeek V4是不是屌爆了啊？ - whatla板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 lecheck 轉寄自 ptt.cc 更新時間: 2026-04-30 05:30:15

看板 Gossiping

作者 freeunixer (離自相空她相)
標題 Re: [問卦] DeepSeek V4是不是屌爆了啊？
時間 Thu Apr 30 04:45:28 2026

※ 引述《sxy67230 (charlesgg)》之銘言：
: 有沒有DeepSeek V4屌爆的拔掛啊？

我這兩天在想要怎麼講 DeepSeek V4 對於中國的意義與價值,
但實際上,這個進展,不只是 DeepSeek,還包括華為、Kimi

DeepSeek:

1.V4 用 FP8+FP4(MoE) 訓練

2.CSV + HBA 暴力壓縮 KV Cache 耗用

3.降低每次啟動參數量

4.MoE 的通訊與計算切更細,改寫算子,做到精度對齊,
在 NV 及華為上可跑出相同的數學結果

達到 unbinding CUDA,使內文視窗可達到 1M tokens

以上,在為以下鋪路

華為:

1.CANN 在 DeekSeek 的支持下有了代表實績可以對抗 CUDA

所以,只需要用華為 950PR 的 NPU(推理用),就能滿足用戶使用,因此

2.950PR 從四月開始到明年,會是 NV 以外,最搶手的中國 LLM 卡.

DeepSeek 破壞性價格,也源自於推理使用時的硬體成本降低(不需 H200 或更高).

Kimi:

1.Prefill-as-a-Service
在 DeepSeek,已經對 KV Cache 的節省做到暴力的降低,
Kimi 做到 KV Cache 的 Prefill 與 Decode 的 Decoupling,
可以讓 Prefill(高算需求) 與 Decode(快速反應)跨節點、跨機房甚至跨低區傳輸,
不再必備 400G 以上的 RDMA,在 100G 的乙太網路,就可運作.
(實測在 20G 以內即可滿足基本使用需求)

並透過切分快取類型 prefix 與 transfer,再提高 cache 利用率及降低頻寬耗用.

在美系 O、G、A、M 全陷入 GPU 缺, token 費用開始暴漲,跟 N 家內鬨混戰的時候,

中系廠商用做黑手的硬幹方式,繼續向其他人展現不輕易向國際土匪低頭的韌性 (~誤

--
※ 編輯: freeunixer (60.250.90.238 臺灣), 04/30/2026 04:50:04

推 error405: 別變戰略武器的話都很好1F 114.36.240.115 台灣 04/30 05:01

推 zelkova: 美國用AI當作戰略武器時就不見有些人放屁2F 207.161.49.22 加拿大 04/30 05:14
→ zelkova: 笑死

推 ilyj2012: 好專業！4F 172.59.215.32 美國 04/30 05:22

推 splendidpoem: 這就是之前巨頭們反對封鎖中國的原5F 111.249.216.237 台灣 04/30 05:23
→ splendidpoem: 因：對中國實施硬體封鎖，讓他們無
→ splendidpoem: 法跟美系巨頭一起燒錢打軍備競賽，
→ splendidpoem: 反而逼迫他們走向了降本增效的另一
→ splendidpoem: 條路。

※ 看板: whatla　文章推薦值: 0 目前人氣: 0 累積人氣: 14　

回到看板(←)《whatla》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享