看板 Stock作者 gn02118620 ()標題 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援時間 Wed Jan 29 08:59:54 2025
※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
來看看大神Andrej Karpathy是怎麼評論的
Andrej Karpathy
https://i.imgur.com/WYEHc65.jpeg
首先要打臉的是第二點
DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費
用是550萬鎂
你訓練使用的GPU,可以當成設備成本,給之後的使用來做攤提,一片H80,一個小時租賃
可以到2~3美元/小時
所以用兩個月來計算,確實符合550萬鎂的訓練成本
而幾乎所有AI 模型都是給你訓練成本,這點DeepSeek沒有不同
這也是為什麼Andrej Karpathy會說這是如同「笑話般的預算」 因為他是其他模型訓練的
1/10~1/20的價格
對照財政部某官員在某財經網美下面被噴到刪留言的事情~嗯 我只能說有這種言論不意
外
https://i.imgur.com/SviWZpc.jpeg
至於你說第一點幻方量化是少年股神變AI大神,因為人家本來就是做大數據的,是用大數
據來炒股財富自由以後才來玩AI,順序不能搞錯
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.7.21 (臺灣)
※ 作者: gn02118620 2025-01-29 08:59:54
※ 文章代碼(AID): #1dcNsDeC (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738112397.A.A0C.html
※ 同主題文章:
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
01-29 08:59 gn02118620.
→ s213092921: 哼!Andrej有我們股神strlen及WTF5566等人了解AI嗎2F 01/29 09:04
推 hcwang1126: 其實老黃也是作加速卡作到變大神 老賈也是作pc作到變大神 蓋天也是作dos作到變大神(現在還有人知道dos?4F 01/29 09:08
噓 liscp: 中國id 要來囉 他們不喜歡這篇7F 01/29 09:10
→ sanos168: 中國大躍進即視感,畝產萬斤糧,讓我們看下去…8F 01/29 09:11
我只能網路有這種言論不意外。畢竟我們財政部官員都是小丑貨色了
現在的台灣有清末義和團的氛圍了,主打一個神功護台、刀槍不入
什麼DeepSeek都是幻覺、妖物,嚇不倒我滴
→ poz93: 他的本業 應該靠這波對沖Ai概念股又賺了一大筆9F 01/29 09:13
推 Dumbbbb: 不能回答8964就是廢物 懂?11F 01/29 09:15
※ 編輯: gn02118620 (1.200.7.21 臺灣), 01/29/2025 09:17:21
推 liliumeow: 對於工作內容就是產製中國的負面新聞的人來說的確是廢物13F 01/29 09:17
推 DecemberLV: 確實炒股呀 放空輝達 放出自己弄的Ai消息 回補輝達 退休 其他不重要了15F 01/29 09:19
→ AirPenguin: 他就照著DS發表的資訊告訴大家有這個東西而已19F 01/29 09:20
噓 sanos168: 呵,畝產萬斤糧,信的人就信吧20F 01/29 09:21
→ AirPenguin: 他的結論是如果DS的講法屬實那可能AI不用那麼多資源22F 01/29 09:22
推 turndown4wat: 好奇幻方做空這樣有賺嗎?沒跌很深反彈又快
ds12月底發表的,發表前幾個月佈局直接被尬爆吧?23F 01/29 09:22
→ s213092921: 幫你補充一下,質疑DS成本的林宜敬不是財政部官員,而是他X的數發部次長,這才可怕25F 01/29 09:22
→ s213092921: 台灣的數發部次長是這種外行人,可以,這很台灣29F 01/29 09:23
噓 arthur52: 如果大陸首先提出AGI模型,那才是大震撼32F 01/29 09:26
推 jay0117: 臺灣人講cp值 要薪水幾百萬官員去挑戰民間年薪幾千幾億人才 真有趣33F 01/29 09:27
→ silentence: 幾十年前吹大煉鋼 人有多大膽 地有多大產的35F 01/29 09:28
→ ctx705f: 要消費時講cp值 要工作時就看齊歐美了36F 01/29 09:28
推 gm3252: 目前都中國自己在吹居多,沒看到什麼名人在挺38F 01/29 09:33
推 renfro928: 以前都是美國割人韭菜,我不信幻方這次沒做空美股割美韭菜,盤前科技股重挫的狀況下,盤中DS發表新模型。能割就代表實力39F 01/29 09:33
推 tttt0204: 幫補血..真實情況如何還能慢慢驗證44F 01/29 09:37
→ lain2002 …
推 lain2002: 台灣千億數位部能點麵線, deepseek能吃嗎?45F 01/29 09:39
噓 greentiger: 義和團是台灣還是中國?有點耐心吧!慢慢看下去47F 01/29 09:39
→ suijojo: 真的越來越像義和團了48F 01/29 09:41
推 stocktonty: 既然都開誠佈公 就等著有其他人去公測啦
真只要600萬鎂很多26科技公司就拿得出來了49F 01/29 09:41
推 s213092921: 看錯了沒報導,只有臆測幻方做空美股XDD
不過幻方本來就是對沖基金起家的,如果這波割美股韭菜也是賺美國的錢繼續發展中國AI,嘻嘻51F 01/29 09:44
→ WTF55665566: 早就說成本都只是推測而已 乍看之下合理 跟超導體當初大吹牛的時候一樣 也是一堆領域大神拿來引用叫囂股價
如果deepseek真的這麼猛 反正也開源 小公司跟上玩小Ai,大公司拆解成本訓練法後補上效率運算的模型後又變回算力軍備競賽了
然後某族群幻想的擊潰鏟子上的義和團夢境還是沒有實現54F 01/29 09:48
噓 meowgy: 股版8卦化62F 01/29 09:53
噓 sanos168: 信的建議趕快砸錢去陸股All in ,不要錯過機會..呵63F 01/29 09:54
→ hcwang1126: 這個比較像日清時 對大炮巨艦的戰術 後來大炮巨艦還64F 01/29 09:54
噓 leighmeow: 其實openai 講的成本包含訓練成本 我覺得這篇才是亂講68F 01/29 09:56
→ IBIZA: 樓上 你才是亂講 openai講的成本在哪?70F 01/29 09:58
→ leighmeow: 目前美國那邊講的成本 的確都包含訓練沒錯71F 01/29 09:58
→ IBIZA: 目前已知的 就是chatgpt3用了相當1萬片A100 14.8天72F 01/29 09:58
→ IBIZA: 的訓練時間
chatgpt 3.5以上全部沒公開
什麼朋友 哪家公司?74F 01/29 09:58
→ IBIZA: 我問chatgpt都問不到 4以上的成本
你比他本人清楚嗎78F 01/29 09:59
→ IBIZA: 唬爛81F 01/29 09:59
→ IBIZA: 一開始說openai講的成本 被打爆 又說是朋友講的
openai自己就沒公開3.5以上的成本
你到底什麼朋友啦 阿特曼喔?83F 01/29 10:00
推 km612tw: 笑死 台灣只有點麵線 哪來的臉質疑別人86F 01/29 10:02
推 lusifa2007: 股價反彈代表市場過度反應 賣鏟子該賺還是得賺87F 01/29 10:03
推 holebro: 這些中黑好可悲 笑死88F 01/29 10:03
推 jwiww: 管你造假不造假股票會漲就好89F 01/29 10:09
→ CCH2022: 如果有作空的然後還一手大吹DS,一手打NV, TSM,會被噴爆吧
顯然DS的訓練費用是特地領域,如果要再更多,多元全面,長時間驗證運作,那預算肯定不夠。
媒體常常推波助瀾去誇大賺流量90F 01/29 10:17
→ IBIZA: 樓上 你的顯然是怎麼來的?
DS怎麼做的論文都有寫95F 01/29 10:18
推 kobebrian: IBIZA 你也不用急著想反駁 市場跟那幾個巨頭比我們了解97F 01/29 10:19
→ IBIZA: 二十幾頁而以 看一下吧
所以meta不就動起來了99F 01/29 10:20
噓 NEWinx: 中國就定期找東西吹啊,吹完就沒下文了,什麼漢芯啊、鴻蒙啊、三折機啊、六代機啊、7nm還被抓包其實透過白手套買GG的,過陣子DS下場差不多101F 01/29 10:21
推 leighmeow: 被打爆什麼啊? 就是美國那邊講的成本都包含訓練啊104F 01/29 10:21
→ IBIZA: 被打爆什麼? 臉啊
chatgpt 4的訓練成本是多少?
講一下105F 01/29 10:22
→ IBIZA: 前一篇就一堆人唬爛 這一篇又一個
什麼其他家都有公布 公布三小啦109F 01/29 10:23
→ Jeff1989: 這柵欄仔不是常常被打臉嗎XD111F 01/29 10:24
→ IBIZA: 什麼其他家都有含什麼什麼
見鬼了112F 01/29 10:24
推 kobebrian: 我知道你投了很多在AI軟體服務啦 但你也不用這麼急114F 01/29 10:24
→ zzahoward: WTF56有點慘,一直拿超導體出來比較,我都不知道是不是反串了117F 01/29 10:24
→ IBIZA: could reach $7bn
這都是推論 好嗎?122F 01/29 10:25
→ IBIZA: 這個不叫公布成本
對 都是去年的新聞 這個就不叫公布成本125F 01/29 10:25
→ zzahoward: 這東西就開源大家都可以下載來玩玩 程式碼也放在那邊 WTF56只能鬼打牆127F 01/29 10:26
→ leighmeow: “training” and inference129F 01/29 10:26
→ IBIZA: 甚麼叫公布成本? ChatGPT 3用V100訓練34天 這個才叫成本130F 01/29 10:26
→ IBIZA: 對 training, 那到底是花了多少GPU時間?
笑死
現在大家討論的訓練費用 就是要這樣算啊 笑死133F 01/29 10:26
→ IBIZA: meta有公布 xAi有公布
ChatGPT只公布到3 DS只公布到V3
誰被打臉很清楚137F 01/29 10:27
→ IBIZA: 這種新聞叫有公布? 笑死我141F 01/29 10:27
推 square: Ds配nv最新晶片最強142F 01/29 10:27
→ kobebrian: 反正現在來看他算力不夠才會扛不住 那些大佬昨天也說了硬體該買還是要買 我就說巨頭不會在這節骨眼賭節省支出 台積電就證明賭對了市場都你的143F 01/29 10:27
→ leighmeow: 你去笑死沒差啊 過年吃年糕小心別噎到146F 01/29 10:27
→ IBIZA: 可憐147F 01/29 10:27
→ IBIZA: 剛剛還說什麼朋友在那間公司149F 01/29 10:28
→ leighmeow: 真的是這樣沒錯啊 哈哈 我跟我朋友都會看英文150F 01/29 10:28
推 theropod: 有指標性球板網紅說好用,就真的是好用151F 01/29 10:29
推 zzahoward: 成本這種東西過兩周就驗證出來了啦 目前風向根據是演算法來看成本相較於目前巨頭極大優勢156F 01/29 10:32
→ zzahoward: 你那個又不是單一模型的訓練費用 是整間公司的不是嗎159F 01/29 10:33
→ leighmeow: 我只是要表達 歐美現在講的成本包含訓練 跟幻方公布的條目不同而已
我沒有要討論哪個模型成本比較高還低161F 01/29 10:33
推 zzahoward: DS是針對單一模型的訓練成本來討論啊,但你背後opex要怎麼allocate誰知道164F 01/29 10:36
推 strlen: 對對對 中國最便宜 最好 你真棒 遙遙領先 讚167F 01/29 10:36
推 Lhmstu: 義和團,蠻貼切的,神功護體168F 01/29 10:37
→ leighmeow: 我在說歐美的成本 包含 訓練+inference,幻方的沒有含訓練成本。你說的是 openai沒公布單一模型 幻169F 01/29 10:37
→ zzahoward: 你要按照income ? utilization? consumptions ?171F 01/29 10:37
→ Jeff1989: DS好像只有公布模型訓練成本,初始成本好像沒看到173F 01/29 10:38
→ leighmeow: 我講的訓練是pre-training + training,幻方的訓練其實就是蒸餾
他們沒有pre-training + training,就是拿別人做好的東西去distill而已174F 01/29 10:39
→ zzahoward: 就沒辦法apple to apple啊 那openai meta也掏出來馬上就戳破了178F 01/29 10:40
→ leighmeow: 其實美國公司都沒在管成本 他們很有錢
原本成本怎樣不是他們主要的考量180F 01/29 10:40
→ zzahoward: 你沒發現meta openai alphabet 都沒在這訓練成本議題上面打轉嗎182F 01/29 10:41
→ TheBeast: 最好沒在管成本啦 唬小也要有葛極限184F 01/29 10:42
→ leighmeow: 就直接raise fund就好了 成本真的沒那麼重要185F 01/29 10:42
→ zzahoward: 最好是成本不是最重要的 這麼大的資本支出邊際成本非常重要好嗎186F 01/29 10:42
→ leighmeow: 應該是說 他們跟中國團隊比 沒有這麼在意成本188F 01/29 10:43
→ zzahoward: 越來越厲害了 成本不重要 請問您在那高就? 老闆不計成本給你薪水嗎189F 01/29 10:43
→ leighmeow: 看看川普 meta openai 花錢的方式吧
都公開資訊
沒錢坑殺孫正義就好
你覺得openai他們到現在為止花錢的方式 是在意成本 還是在意模型產出XD
在意成本的話就跟台灣依樣吧 只買得起五片做不起什麼模型191F 01/29 10:44
推 zzahoward: 邊際成本是另外一回事,就算搞AI還是要在意邊際成本的
不然Data center設備幹麻還開標案 就都用最頂的就好啦201F 01/29 10:47
推 leighmeow: 他們真的跟台灣人一樣在意成本 根本就不會有幾十萬片gpu好嗎 我在台灣聽到的單位有5-10片就很屌了
成本當然重要啊 我講的是跟中國團隊的考量的先後順序
沒歐美做模型出來哪裡有給他們distill的基準205F 01/29 10:48
→ bnn: 訓練成本就跟訓練成本比210F 01/29 10:49
推 hcwang1126: 我們200億的花法 不像只有2億的窮鬼啊211F 01/29 10:49
→ zzahoward: 邊際成本和總成本的區別,他們願意投資鉅額資本支出是建立在邊際效益存在的情況212F 01/29 10:49
→ bnn: 要多文盲才會拿總成本跟訓練成本比啊214F 01/29 10:50
→ zzahoward: 大手大腳花錢背後是一堆財務模型好嗎215F 01/29 10:50
→ bnn: 而做軟體應用的公司 你跑去美國租算力來訓練不行嗎你買不到十萬片 又不表示你不能租算力做軟體應用216F 01/29 10:51
推 leighmeow: 沒錯 他們背後有財務模型 所以才不用像中國公司那樣這麼注意成本218F 01/29 10:52
→ bnn: 就像牙膏有Fab也有豬屎部門 上下游都想自己搞221F 01/29 10:54
→ bnn: 啊豬屎屋外包GG代工也是一種營利模式 有沒有要自己投資買卡架起來 哪一個財務模型適合你的商業模式
你大額資本支出 到時候有沒有可能像牙膏Fab切不掉你純當豬屎屋 有沒有可能被代工/出租算力卡脖子223F 01/29 10:54
噓 zonezone: 韭菜腦還在吹,難怪整天被土共割韭菜227F 01/29 10:56
推 lonelyQQ: 連館長都說這東西超牛還有人在崩潰228F 01/29 10:57
→ bnn: 這你放在財務模型參數隨便改一下權重隨你怎麼掰的229F 01/29 10:57
推 CGDGAD: AK的結論是並非不需要這麼大量的GPU,但要確保資源不浪費,在資料給演算法上還有很大進步空間235F 01/29 11:16
→ samnpc: 中黑跟中吹果然是同文同種237F 01/29 11:19
→ hihi29: 這篇中肯 老鐵還是有料的238F 01/29 11:28
→ a9564208: 還有人在跳針中國有多少GPU喔?
唯一可知是川普要不要繼續禁吧239F 01/29 11:29
推 swingman: 依黑悟空的經驗大概要再吹一個月
大家再忍忍241F 01/29 11:37
推 AirLee: TSMC:你終究還是需要很多的高階晶片。 一直沒機會撿便宜的,星期一晚上不是應該要all in 了。244F 01/29 11:41
推 ronga: 但事實上硬體不段進步 AI天花板就能繼續拉高 不會因246F 01/29 11:42
→ ronga: 為你用1/10的算力就能達到的事 就不需要更好的硬體248F 01/29 11:42
推 lovepork: 我會這麼解讀 1/20等於可以19/20拿去做其他模型訓練搞不好 有其他更成功模型 沒被揭露 細思極恐
中國做AI根本不缺錢和能源
能源他們自己就多少水壩和核能電廠了249F 01/29 11:48
→ bnn: 啊鏟子就會少買了啊253F 01/29 11:51
推 ronga: 不會少買 比方說本來天花板才100,但因為新的演算法天花板可以到1000。
一直都是硬體在限制軟體的極限254F 01/29 11:57
→ bnn: 不會少買 是買的時間拉長 gating在公司人腦
他不用急著編預算找錢採購搶卡 可以攤到好幾年買
啊做鏟子的財報看下去還不是少買257F 01/29 11:59
推 leighmeow: 重點除了他們用GPU有多少之外,還有他們說謊這件事啊,誠信很重要
在那邊罵的中吹昨天有沒有繼續放空nvidia ,沒有的話都是在嘴而已
我前天120接了 謝謝264F 01/29 12:37
→ IBIZA: 對帳單呢269F 01/29 12:39
推 leighmeow: 貼給你的話你會跳樓嗎
還有我在ptt以外看的平台 一堆人接117-120的 沒這麼難吧 這邊的人腦袋太神奇了270F 01/29 12:39
→ IBIZA: 好啊 我馬上從窗戶跳下去 你貼啊273F 01/29 12:40
→ IBIZA: 先跟你說我住一樓
快貼吧
說有買附對帳單不是剛好275F 01/29 12:41
→ leighmeow: 那算了
我沒好處不貼的 你可以看我以前的文我也貼過278F 01/29 12:41
推 take3024: 這樣wtf5566要怎麼回應280F 01/29 12:43
→ IBIZA: 笑死 不敢貼了281F 01/29 12:43
→ IBIZA: 我用pttweb沒有看到你有1/27之後的以前的文283F 01/29 12:44
→ leighmeow: 抱歉我懶得花時間跟你講話了 你要跳海或是從高樓跳下去 再通知我 不過算了 你應該先笑死了
中吹水準就這樣而已287F 01/29 12:45
→ IBIZA: 好啦 唬爛了一早上 快滾吧290F 01/29 12:46
→ leighmeow: 趕快去做空nvidia all in華為 加油
你也沒單啊 要求別人做事啊
你哪位
中吹真的廢
我有單不想給你看而已 因為不太想被別人免費指使
你先匯款到我帳戶我在考慮291F 01/29 12:46
→ IBIZA: 笑死 我又沒說我買 說自己買了附單子不是基本嗎
好了啦 股神297F 01/29 12:48
→ leighmeow: 有基本嗎? 那你去找別人吧 別找我 你問問版主這裡是不是基本299F 01/29 12:48
→ SYMS: 整天討論他國事務,實際點,想想台灣除了台積能吹,剩下什麼?別整天靠酸中國掩蓋啊301F 01/29 12:49
→ leighmeow: 我收虛擬幣喔 現在詐騙太多
你先匯款我就貼單喔
這裡的版規有寫 自己有買就要貼單是基本嗎? 你找給我看303F 01/29 12:49
→ IBIZA: 帳號先公布出來啊 要人匯款這也是基本307F 01/29 12:50
噓 Phamalpha: 這版就是一堆賠錢韭菜啊昨天跌一堆賠錢狗出來吠308F 01/29 12:50
→ IBIZA: 帳號先公布出來啊 要人匯款這也是基本
快點 公布帳號309F 01/29 12:50
→ IBIZA: 長一張嘴312F 01/29 12:50
→ leighmeow: 你有要匯款再跟我要喔 沒有就算了313F 01/29 12:50
→ IBIZA: 好啊 站內信來啦 我幫你公布314F 01/29 12:50
→ IBIZA: 又算了 話都你講的 最後都算了 笑死
哈哈317F 01/29 12:50
→ IBIZA: 不敢給帳號就不要嗆啊
不敢給帳號就不要嗆啊
笑死我320F 01/29 12:51
→ IBIZA: 笑翻 嗆要匯款不敢給帳號 惱羞成怒是怎樣
怎麼那麼逗趣324F 01/29 12:54
推 tangolosss: 支那粉蛆才爽一天 又開始自卑了 說好的重擊美股? XD326F 01/29 12:54
推 a28200266: 過年第一天就要上股版吵架阿不然幹嘛?329F 01/29 13:05
推 leighmeow: 你沒有要匯款只想公布我帳號吧
還有說自己有買就要貼單的「基本」是在哪看的 我沒看過類似的版規
為什麼我要透漏自己的個資給你啊
你先給我身分證好了 我就給你帳號 避免被曝光
想要身分證+帳號 拍照 謝謝喔330F 01/29 13:06
→ leighmeow: 我就是有單 才敢跟你要這些 黑衣黑衣
明明前幾天一堆人撿117-120 為什麼在中吹眼裡不可思議 還要貼單不然就是唬爛啊
中吹是都活在什麼世界啊 只有當韭菜的份嗎337F 01/29 13:08
噓 gekkou: 某人講到腦羞嗆人去死 也太沒水準,網路互嘴,嘴到這地步真的好弱
這麼玻璃心其實可以上來網路嘴,回同溫層取暖就好,留點口德吧
不用上網路嘴,說錯341F 01/29 13:22
噓 cheng399: 麵線愛好者的意識型態覺得笑死346F 01/29 13:26
→ AZ09 …
推 AZ09: 笑死 都有人縮了還要上這台車哦347F 01/29 13:45
→ Risedo: 為什麼要跟蟲子吵架?348F 01/29 13:47
→ busman214: 欸 可是他不是幫DS背書欸... 他只是說GPU的租賃費用和DS團隊宣稱的訓練費用對得上而已,你貼這篇是要打臉什麼?350F 01/29 14:31
→ wiie: 怎麼有人過年崩潰成這樣,真的會笑死XDDDD353F 01/29 14:57
噓 demintree: 可以給開源training的連結嗎,他GitHub上只放訓練好的模型和inference的程式354F 01/29 14:57
噓 repast: 可憐啊又再蝦吹356F 01/29 14:58
--