※ 本文為 lecheck 轉寄自 ptt.cc 更新時間: 2026-04-30 05:30:15
看板 Gossiping
作者 標題 Re: [問卦] DeepSeek V4是不是屌爆了啊?
時間 Thu Apr 30 04:45:28 2026
※ 引述《sxy67230 (charlesgg)》之銘言:
: 有沒有DeepSeek V4屌爆的拔掛啊?
我這兩天在想要怎麼講 DeepSeek V4 對於中國的意義與價值,
但實際上,這個進展,不只是 DeepSeek,還包括華為、Kimi
DeepSeek:
1.V4 用 FP8+FP4(MoE) 訓練
2.CSV + HBA 暴力壓縮 KV Cache 耗用
3.降低每次啟動參數量
4.MoE 的通訊與計算切更細,改寫算子,做到精度對齊,
在 NV 及華為上可跑出相同的數學結果
達到 unbinding CUDA,使內文視窗可達到 1M tokens
以上,在為以下鋪路
華為:
1.CANN 在 DeekSeek 的支持下有了代表實績可以對抗 CUDA
所以,只需要用華為 950PR 的 NPU(推理用),就能滿足用戶使用,因此
2.950PR 從四月開始到明年,會是 NV 以外,最搶手的中國 LLM 卡.
DeepSeek 破壞性價格,也源自於推理使用時的硬體成本降低(不需 H200 或更高).
Kimi:
1.Prefill-as-a-Service
在 DeepSeek,已經對 KV Cache 的節省做到暴力的降低,
Kimi 做到 KV Cache 的 Prefill 與 Decode 的 Decoupling,
可以讓 Prefill(高算需求) 與 Decode(快速反應)跨節點、跨機房甚至跨低區傳輸,
不再必備 400G 以上的 RDMA,在 100G 的乙太網路,就可運作.
(實測在 20G 以內即可滿足基本使用需求)
並透過切分快取類型 prefix 與 transfer,再提高 cache 利用率及降低頻寬耗用.
在美系 O、G、A、M 全陷入 GPU 缺, token 費用開始暴漲,跟 N 家內鬨混戰的時候,
在美系 O、G、A、M 全陷入 GPU 缺, token 費用開始暴漲,跟 N 家內鬨混戰的時候,
中系廠商用 做黑手 的硬幹方式,繼續向其他人展現不輕易向國際土匪低頭的韌性 (~誤
--
※ 編輯: freeunixer (60.250.90.238 臺灣), 04/30/2026 04:50:04
推 : 別變戰略武器的話都很好1F 114.36.240.115 台灣 04/30 05:01
推 : 美國用AI當作戰略武器時就不見有些人放屁2F 207.161.49.22 加拿大 04/30 05:14
→ : 笑死
→ : 笑死
推 : 好專業!4F 172.59.215.32 美國 04/30 05:22
推 : 這就是之前巨頭們反對封鎖中國的原5F 111.249.216.237 台灣 04/30 05:23
→ : 因:對中國實施硬體封鎖,讓他們無
→ : 法跟美系巨頭一起燒錢打軍備競賽,
→ : 反而逼迫他們走向了降本增效的另一
→ : 條路。
→ : 因:對中國實施硬體封鎖,讓他們無
→ : 法跟美系巨頭一起燒錢打軍備競賽,
→ : 反而逼迫他們走向了降本增效的另一
→ : 條路。
--
※ 看板: whatla 文章推薦值: 0 目前人氣: 0 累積人氣: 10
作者 freeunixer 的最新發文:
- Intel讓PC記憶體變顯卡記憶體,AI大模型人人都能玩,告別高價VRAM 英特爾(Intel)近日發布了一項革命性的驅動程式更新,大幅放寬了 Arc 系列 顯示卡與 Core Ultra 內建 …130F 49推
- 6F 5推
- 21F 3推
- 21F 7推 1噓
點此顯示更多發文記錄
回列表(←)
分享