看板 Stock
作者 Lushen (pttlushen)
標題 [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
時間 Fri Jan 24 19:13:02 2025


原文標題:

Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋

原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释 | 机器之心 工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 ...

 

發布時間:2025/01/24

記者署名:機器之心

原文內容:

「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」

DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。

最先陷入恐慌的,似乎是同樣推崇開源的 Meta。

最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。

原文如下:

這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。

工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。


管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?

DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。

這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。

https://i.imgur.com/hKZ6h5W.png

貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。

不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。

https://i.imgur.com/mJn5POl.png

而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。

https://i.imgur.com/NLhp4Nj.png

看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。

有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」

https://i.imgur.com/gQ5fHDH.png

還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」

https://i.imgur.com/HIFcTx6.png

不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。

https://i.imgur.com/HIFcTx6.png

目前,我們還無法確定貼文的真實性。

不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。

心得/評論:

Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大

DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜

DeepSeek 這件事情也不光是中國自己在吹噓

看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大

DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論

https://i.imgur.com/NLhp4Nj.png

DeepSeek R1 開源+論文公開應該會推進一波AI界的發展

DeepSeek 後續發展值得關注一下

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 作者: Lushen 2025-01-24 19:13:02
※ 文章代碼(AID): #1datN1_K (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html
pmes9866: 中又贏1F 01/24 19:14

DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)

自己實際使用體感不覺得他贏 OpenAI

不過以成本場景來說真的是巨大的創新

美國知名的 AI 分析機構 Artificial Analysis

對 DeepSeek 的成本分析

https://i.imgur.com/0GRkj6Q.png

agassi001: 股價該跌了吧2F 01/24 19:15
wts4832: too good to be true3F 01/24 19:15
moom50302: 贏了贏了都贏了4F 01/24 19:15
Plumpy: 贏麻了5F 01/24 19:16
s1612316: 花大錢還輸別人 是設備的問題還是人的問題6F 01/24 19:16
kenbbc12321: ai本來就可以減少運算,達到一樣的效果7F 01/24 19:18
lpmybig: 真實性先打問號8F 01/24 19:18

DeepSeek R1 程式碼、論文都開源+公開了

https://github.com/deepseek-ai/DeepSeek-R1
GitHub - deepseek-ai/DeepSeek-R1
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

 

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek-R1/DeepSeek_R1.pdf at main ·  deepseek-ai/DeepSeek-R1 ·  GitHub
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. ...

 

appledick: 美國484真的滿廢的
難怪只能靠制裁來贏人了9F 01/24 19:18
lc85301: 美國的時代早就過去了11F 01/24 19:19
zhi5566: 輸了就在砍人啊12F 01/24 19:19
kuosos520: deepseek有開源,也有offline,鬼故事來了13F 01/24 19:20
aegis43210: 因為西台灣為了管制,一堆問題不能回答,自然也不算錯誤14F 01/24 19:20
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15
KrisNYC: DS就開源的  輸了就算了 裁部門 丟模型16F 01/24 19:22
furbyyeh: 硬體需求果然是吹的17F 01/24 19:22
KrisNYC: 拿DS去從頭開始而已18F 01/24 19:22
stlinman:  降本增效  遙遙領先 中國人可以贏兩次19F 01/24 19:22
rrazer: 中又贏 ,遙遙領先20F 01/24 19:22
momochacha: 沒空 阿祖現在忙著舔川普21F 01/24 19:22
KrisNYC: 你就當作花錢蓋了個蚊子館又拆掉 GDP增加了 就這樣寫一大篇不知道想幹嘛22F 01/24 19:22
Lowpapa: 美國早就輸慘了24F 01/24 19:23
godog: 看到某族群崩潰狂酸的樣子 就覺的好笑 哈哈哈25F 01/24 19:23
aegis43210: 只要慶豐帝仍在位,美國就不會輸26F 01/24 19:24
iamsosmart: 中國贏了,台積電嚇哭了,輝達沒有用了,美國七大科技股都淚奔了27F 01/24 19:24
huabandd: 整理重點好嗎29F 01/24 19:25

網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投

Marc Andreessen

幫你整理了重點

https://i.imgur.com/SmUbN8M.png

Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.

DeepSeek 翻譯:

https://i.imgur.com/5zX1uf2.png

ImHoluCan: 亞洲專門搞詐騙的30F 01/24 19:26
poeoe: 中國本來在軟體就算強的 還能加班加到爆31F 01/24 19:26
strlen: 不就魔改技術很猛?不然當年GPT3怎麼不是中國開發32F 01/24 19:27
winsonpz: 看智障聳動標題就知道是中吹假新聞33F 01/24 19:27
zpeople0116: 歐美日常,幹輸人翻桌34F 01/24 19:28
winsonpz: 然後又一堆壯世代在那瞎講胡吹35F 01/24 19:29
ImHoluCan: 美國人很天真,很容易被詐騙,看看小米保時捷,那真的是保時捷嗎36F 01/24 19:29
spa41260: 算力過剩,丸子38F 01/24 19:29
pagenotfound: 上次在那邊吹中國突破5奈米的公司 已經屍骨無存了39F 01/24 19:29
matlab1106: 又要像電車一樣輸了就翻桌嗎?40F 01/24 19:29
ck326: 中吹日常,吹了半天強國還在通縮41F 01/24 19:30
ImHoluCan: 對岸要是真的,早就大吹特吹42F 01/24 19:30
asjh612: 沒有外媒新聞? 怎麼只有中國跟twitter來源43F 01/24 19:30
mic73528: 遙遙領先 雙贏就是中國贏兩次44F 01/24 19:31
Blastodern: 彎道超車吹了三十年還在超,這個彎道到底有多長啦,笑爛45F 01/24 19:31
ImHoluCan: 小米蘇7=美國老邏輯=保時捷怕拉沒拉,但真的擺上台面真的是保時捷嗎48F 01/24 19:32
Dix123: 已經都開源了 怎麼還有人反智阿...50F 01/24 19:33
jacktypetlan: 完蛋 算力過剩 overbooking 台G NV攔腰斬都不夠
NV至少1/4膝蓋斬 歐印放空 台股一萬二見51F 01/24 19:33
kotorichan: 美國再挖角或制裁 就好53F 01/24 19:34
bella1815: 看到某族群自嗨的樣子就覺得好笑54F 01/24 19:34
INIKS: 美國創意,中國實作,中美如果真正合作,早就登陸火星了,可惜國家這個沒用的概念依然存在,地球村遙遙無期55F 01/24 19:34
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47
ImHoluCan: 當初嘴台積電,也大力挖台積電的大將,對啊晶圓廠可以生產啊,但真的能ㄧ直突破?58F 01/24 19:34
ck326: 開源又怎樣?笑死60F 01/24 19:35
poeoe: 開源就是全世界的人都能直接驗證 這也不是中國自己在吹啦61F 01/24 19:35
z23061542: OK收到 以放空美台股 大力ALL IN鹿谷63F 01/24 19:35
asjh612: 開源又怎樣 原po也沒覺得他贏openai啊64F 01/24 19:35
ImHoluCan: 詐騙集團,當然不能犯低接錯誤,你能看到的當然要給你看你想看的65F 01/24 19:36
kotorichan: 沒三小路用 中國直接武統是最有用的67F 01/24 19:36
asjh612: 自爽又贏 跟 開源 哪門子關係?68F 01/24 19:37
ImHoluCan: 笑死中國要是真的能搞出來,當初中芯肯定能搞出來69F 01/24 19:37
asjh612: 每個llm都在吹自己很強 實際體驗就是那死樣子70F 01/24 19:37
a12838910: 中國軟體很強啊 抖音 小紅書 台灣?71F 01/24 19:38
andy810306: 台灣給那狗屎薪資想要找誰寫軟體?笑死72F 01/24 19:38
aloness: 這本來就是 在等待程式架構進化,縮減算力73F 01/24 19:39
jasonfun44: 老早都去AWSGCP租就好,做LLM跟本不會賺錢74F 01/24 19:39
aloness: 舊的程式架構自然需要突破天際的算力75F 01/24 19:39
ImHoluCan: 對岸是小米蘇7保時捷,然後吹說你開保時捷嗎?76F 01/24 19:39
ck326: 台灣軟體很爛啊,應該說台灣沒有軟體,所以呢?77F 01/24 19:40
Dix123: 簡單來說 AI的這個嶄新的領域配上開源 本來就很容易做出超強的突破了 不一定是中國 美國隨時也會趕上78F 01/24 19:40
jasonfun44: 馬斯克也是吹80F 01/24 19:40
poeoe: 這其實也是好事 如果能讓需要的算力降低 那能省很多81F 01/24 19:40
Dix123: 你遙想個人電腦和網路剛開始的時候 駭客橫行的時候83F 01/24 19:40
bj45566: 股板無腦中黑:不管啦,中國只會抄襲而已而已啦,一定是偷美國的!原始碼都公開在網上了?不可能!看得到的人一定是眼睛孽障太重,我什麼都看不到!(嘶喊)84F 01/24 19:40
aloness: 中國軟體工程師戰力本來就不差87F 01/24 19:40
Dix123: 當你還在用數據機玩天堂的時候 可能想過幾年後馬上88F 01/24 19:41
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10
ImHoluCan: 對岸很多都是抄美國,卡卡西董嗎? 小米蘇7吹成保時捷89F 01/24 19:41
Dix123: 變月租吃到飽?91F 01/24 19:41
ixiuxiudan: 別急92F 01/24 19:41
asjh612: 怎會熱血親中的人在高潮啊93F 01/24 19:42
ImHoluCan: 對岸只會卡卡西,但真的有那個創意與技術? 接下來真的能持續?94F 01/24 19:42
s90002442: 完蛋 今天股價砍爛96F 01/24 19:42
kevinmeng2: 拿meta這垃圾比較就好像拿intel跟台積電比97F 01/24 19:42
peter98: META再裁個15%工程師吧98F 01/24 19:44
jinx5566: 突破AI臨界點了?99F 01/24 19:44
raymonde: ai 是不是關門放狗100F 01/24 19:45
aaa95308: 樓上把軟體跟半導體製造放在一起比較的...好喔101F 01/24 19:48
bj45566: 說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama102F 01/24 19:48
t0314796: 報告 所以會影響到什麼?想抄答案!104F 01/24 19:48
jiansu: 這個成果是中國其他公司都震驚吧 開源很好 科技不應該分國界 競爭也不分你我 生死看淡 不服就幹105F 01/24 19:49
ken123321987: 美國狗下棋輸人就翻桌 等中國強起來一定算帳107F 01/24 19:49
BIGETC: 一個專案五千萬能弄 五百萬常常也可以 科科108F 01/24 19:50
asjh612: 不過仔細想想 這篇股點是什麼? meta利空?109F 01/24 19:50
BIGETC: 不過五千萬弄大家都會很舒服 何必真的編五百110F 01/24 19:50
djbell: 繼續裁員111F 01/24 19:51
boy1031: 鋼鐵家電手機電車都能卷翻,美歐日,憑什麼AI不能卷,至少也要分走3成市場112F 01/24 19:51
amethystboy: 便宜治百病114F 01/24 19:54
asjh612: 還是這篇是台積nv利空 大家不需要那麼多運算資源?115F 01/24 19:55
super0949: Meta股價毫無反應116F 01/24 19:55
keyneslan: 這樣如何對股東與投資機構交代117F 01/24 19:55
CYL009: 用低階顯卡AI性能就能和用高階的比了 反正美國錢很多 嘻嘻118F 01/24 19:55
pieceioriX: 為何高低成本的方案不能共存?120F 01/24 19:56
oldEn15: 產能過剩要來了 啾咪121F 01/24 19:56
s1612316: 五千億鎂 有多少會進口袋122F 01/24 19:56
bj45566: DeepSeek 最大的影響就是證明中國能用不到 1/10 的預算和更少、更便宜低階的 AI 晶片達成甚至超越美國頂尖 AI 公司(s)狂開資源做出的大語言模型效能123F 01/24 19:56
ggbi4zzz: 中國黑開始胡言亂語126F 01/24 19:56
CYL009: 現在深度探索全部開源給你 誰還要用高價裝備操作AI嘻嘻
最近這幾天美國科技業真的瘋了 一直再找出為什麼可以這麼便宜成本弄出來ww127F 01/24 19:57
eriker: 我怎麼看起來再說deepseek造假131F 01/24 19:58
uller: 中國黑科技 猛了132F 01/24 19:58
eriker: meta試著用h100訓練了15個開源的deepseek結果數據都不如paper宣稱的133F 01/24 19:59
shorty5566: 既然都開源了接下來就看能不能照刻出來啊 現在吹這麼早都不怕跟之前超導體一樣翻車嗎?135F 01/24 20:01
eriker: 這根本就是沒辦法reproduce吧 meta工程師拿你程式碼訓練這麼多次都拿不到你的結果137F 01/24 20:01
qazwsx0128: 笑死,就算成本降低需求只會更多,直到人手一個客製ai139F 01/24 20:01
dongdong0405: 哈哈哈中國進來卷141F 01/24 20:02
eriker: 那正常人用更爛的gpu或是deepseek宣稱的h800不是也不辦法訓練出來嗎142F 01/24 20:03
bj45566: 拿 AI 比高階晶圓製造的真的笑死!中國在 AI 領域一直都能和美國爭霸,中國在 AI 頂尖會議的論文發表和144F 01/24 20:03
ck326: 看起來是 nvda ,tsm 股價準備崩潰,什麼你說市場沒反應?怎麼會?146F 01/24 20:03
bj45566: 美國一直都是互有領先(之前中國 AI 強在 CV, PR,美國強在 LLM, NLP -- 但現在看起來美國的強項不太妙)148F 01/24 20:03
eriker: 中國不意外 只能騙騙外行人151F 01/24 20:03
kingofsdtw: 果然演算法是最重要的152F 01/24 20:04
shorty5566: 而且看不懂為啥對nv是利空 如果是真的那那些csp用現在已有的算力不是更猛 需求只會更多吧 發展越快越好153F 01/24 20:04
eriker: 之前就懶得認真看deepseek 結果一看根本在騙白癡156F 01/24 20:05
appledick: 這讓我想到智慧型手機android平台 一開始的硬體不夠強 真的是要靠各家用軟體調效來拼順暢度157F 01/24 20:06
squeakywheel: 就是美國抄襲中國啦 某族群最愛嘴的159F 01/24 20:06
appledick: 後來硬體強到靠北 軟體就不用調效了 硬體隨便淦都爆淦順160F 01/24 20:06
bj45566: 無腦中黑已經進入催眠自己的最高境界了 wwww wwww162F 01/24 20:06
eriker: 中國人應該沒想到這次翻船 meta真的拿他的h100檢查deepseek造假163F 01/24 20:08
ilGroundhog: 搜尋一了一下DS在寫作編碼不如GPT但是推理媲美165F 01/24 20:08
asjh612: 超越美國製造的llm言之過早吧 每個新的出來都說贏166F 01/24 20:09
bj45566: 最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學能力測驗上作弊喔,嘻嘻167F 01/24 20:09
ilGroundhog: 重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場169F 01/24 20:09
eriker: 通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會這樣會浪費一堆算力證明造假170F 01/24 20:10
ilGroundhog: 如果可以便宜泛用的話對NV就不是好消息172F 01/24 20:10
asjh612: 然後講中國ai paper 之前就聽過中國的有些是吹的173F 01/24 20:10
joygo: 正在用 只能說 好用174F 01/24 20:11
koll: 那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好175F 01/24 20:11
asjh612: 講別人無腦黑中 自己才無腦親中 笑死176F 01/24 20:11
mcgrady12336: 未來AI就中美有量能切入啊177F 01/24 20:11
eriker: 但這次被meta抓到deepseek造假 好慘178F 01/24 20:12
joygo: 最近剛好在玩google 的和這隻 互相179F 01/24 20:12
andy810306: 某樓是不是在酸所有IC設計啊,應該用7奈米就好啊,一直想推先進製程幹嘛XDDD180F 01/24 20:12
JoeyChen: 歸結是成本的問題對吧?182F 01/24 20:13
andy810306: 是不是廢到只能靠製程來掩蓋廢物設計能力啊183F 01/24 20:13
eriker: 不過我猜之後這種文會繼續洗 反正普通人也不懂ai184F 01/24 20:13
b9513227: 你們慢慢吵 哥買tsm nv等看戲185F 01/24 20:13
bj45566: 科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSeek 背書說它是 AI 的 "breakthrough" 了,股板鍵盤俠覺得自己比那些專家還懂 wwww wwww186F 01/24 20:13
s213092921: Deepseek用閹割版H800就能做到,189F 01/24 20:13
shiowshay: 真的超強,只是不知道為什麼他無法回答我1989年6月4日有什麼歷史事件190F 01/24 20:14
asjh612: nlp更好吹sota 反正自製dataset 別人亂做 自己認真192F 01/24 20:14
asdf70114: 終於要遙遙領先了193F 01/24 20:14
appledick: 中黑病發作194F 01/24 20:14
SunRoy: 英偉達的股價下跌 我就信195F 01/24 20:14
joygo: 谷歌的很爛 問股票問題不敢回答 chatgpt比較大膽196F 01/24 20:14
appledick: 哥布林不要只會網上酸 拿出東西比較有意義197F 01/24 20:15
eriker: 怎麼不敢回答meta訓練15次 開源的deepseek結果數據不如paper宣稱的?198F 01/24 20:15
sid3: 有競爭是好事  今年韓媒也有新聞200F 01/24 20:15
asjh612: 教授也會被騙啊 笑死 以為教授多懂 早就沒在做實驗201F 01/24 20:16
b9513227: 我快笑死 問中國最新jdk版本是啥 跟我說17202F 01/24 20:16
eriker: 這不是造假不然是什麼203F 01/24 20:16
asjh612: 是不是沒讀過研究所阿 還吹教授204F 01/24 20:17
Gipmydanger: 中國贏麻了,只好加大禁令了205F 01/24 20:17
ilGroundhog: 對台積應該沒很大的影響就算少了輝達的訂單還有其他207F 01/24 20:18
bj45566: 是啦,中國發表在 AI 論文都是吹的、假的!要隨論文附上的原始碼也都是假的!那些全世界 AI 專家組成的審稿 TPC 都是一群白癡廢物,怎麼可能比股板鍵盤俠更懂 AI 是吧? wwww208F 01/24 20:18
eriker: 還是meta工程師都廢物 有一堆h100 還訓練不好deepseek212F 01/24 20:18
andy810306: 某樓自己能力差讀水貨研究所找廢物教授,以為美國教授跟你教授一樣廢,●●比雞腿,真的笑死214F 01/24 20:19
tomatobus: 教授審論文不會去嘗試reproduce吧,除非他叫底下的博士生去試216F 01/24 20:20
sa87a16: 12億人口免費的運算怎麼輸218F 01/24 20:20
ilGroundhog: DS的初始模型是META的模型只是變得更有效率219F 01/24 20:20
bj45566: 反正股板的無腦中黑覺得自己比所有業界、學界的知名專家都還要懂 AI wwww wwww220F 01/24 20:21
eriker: 更好笑的是pytorch就meta的 開源還要比三小222F 01/24 20:21
tomatobus: 如果meta工程師無法reproduce,那可能真的有什麼貓膩。企業一定是最緊張的223F 01/24 20:21
asjh612: 笑死 開始嘴別人教授喔 實際上就是這樣啦 國外也是AI paper一堆 真的沒人有空一篇一篇跟你對225F 01/24 20:21
s213092921: https://news.cnyes.com/news/id/5816770 人家早就預言了227F 01/24 20:23
bj45566: 頂尖會議那些學界業界最知名的專家的審稿委員當然會試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你抓不出來,你直接名聲掃地好嗎229F 01/24 20:24
ilGroundhog: 如果成功還是需要訓練模型 只是算力降低很多232F 01/24 20:24
s213092921: 2千多塊閹割版的H800只要訓練兩個月就超越Meta chatGPT,美國可憐啊233F 01/24 20:24
eriker: 中國在paper也喜歡造假硬體 明明用h100還說自己用h800或是3080235F 01/24 20:25


我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@
可以請你提供一下嗎

bj45566: 美國一流大學教授就算是五六十歲都還在自己做研究、寫程式,井底之蛙覺得自己比 UC Berkeley 教授還厲害,哈哈哈哈237F 01/24 20:26
lepidoptera: 便宜很好啊 大家股價修正一下 重新開始240F 01/24 20:27
ntr203: nv有什麼好怕的,越強的晶片不就代表可能做出越強的ai241F 01/24 20:27
appledick: 反觀台灣在AI運算這一塊484完全沒了243F 01/24 20:28

AI製造供應鏈台灣應該還是掌握得牢牢的

AI模型目前看起來是真的沒料

幾乎都是拿別人的成果fine-tune、扶不上牆

appledick: NV沒啥好怕啊 軟體寫的好跟硬體強又不抵觸244F 01/24 20:28
shorty5566: 真的 看不太懂對nv利空在哪 用現在最強的nv去算不是更好更令人興奮嗎 而且入門門檻降低對整個ai發展都是好事 集中在幾個大型csp才不好245F 01/24 20:29
s213092921: https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割版的H800顯卡,中黑趕快面對現實吧
http://i.imgur.com/u8wpYYZ.jpg248F 01/24 20:29
美晶片戰難以對中國封喉 ? 彭博示警中國AI公司已突破「這1點」 - 自由財經
高佳菁/核稿編輯 〔財經頻道/綜合報導〕日前,中國AI公司推出與ChatGPT功能不相上下的新模型,但訓練時間極短、且成本不高,恐被視為中國AI技術的躍進象徵。《彭博》專欄作家、美國喬治‧梅 ...

 

這紅媒吧?

lon0623: 台灣人力有限,與其發展AI運算,倒不如找應用端251F 01/24 20:30
bj45566: 無腦中黑已經無所不用其極在催眠自己一切都是假的 wwww pathetic SORE losers !!!252F 01/24 20:30
appledick: 中國一堆都是去拿Mac mini來跑meta的模型 便宜又可以玩254F 01/24 20:31
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09
h0103661: 這完全開源,是假的早就被抓了吧256F 01/24 20:31
s213092921: 中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta及GPT,誰要花大錢買一堆NV最新顯卡?257F 01/24 20:31
lon0623: 不覺得台灣的做法有什麼錯誤,又不是有上億人口259F 01/24 20:31
h0103661: 還是要先跟研究生解釋什麼叫開源260F 01/24 20:31
eriker: 你這篇的Lisan al …他說的就是這個意思261F 01/24 20:32
shorty5566: 反過來說你用nv最強的顯卡去跑不是能進步得更快嗎?還是你覺得ai的發展已經到盡頭了?262F 01/24 20:32
eriker: 他不是說meta訓練了15次deepseek v3結果還是比他們264F 01/24 20:33

https://i.imgur.com/mJn5POl.png

尷尬

他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次

much better model

這大概國中英文

要不是你語言能力有缺陷

就是真的很純的中黑

eriker: 宣稱的差嗎265F 01/24 20:33
ggian123: Don’t look up 大陸人還生活在水深火熱266F 01/24 20:33
shorty5566: 挫勒蛋的絕對是那些開發模型的公司吧267F 01/24 20:33
lon0623: 你覺得你想得到的NV想不到嗎?
NV有他厲害的地方,不是只有算力268F 01/24 20:33
chanceiam: 連繁體中文都不能回答的模型270F 01/24 20:34
eriker: 所以meta驗證了deepseek放出來的程式碼跟模型 發現他們造假
…. 建議你看英文271F 01/24 20:34

是你的英文能力有缺陷。

我建議你別搞笑了

這真的在扯中黑的腿

jjjj222: 高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了274F 01/24 20:35
scitamehtam: deepseek我有用,真的蠻好用的275F 01/24 20:35
shorty5566: 開發模型的公司即將進入紅海 倒是nv只怕大家都改用asic,但是門檻降低以後小型玩家可以進場,那些小型玩家也沒能力調教asic 還是要跟nv買通用gpu276F 01/24 20:35
jjjj222: 功能也就是騙騙白痴.. 特別是中國白痴279F 01/24 20:36
ilw4e: 就跟當初阿法狗一樣啊,deepmind搞出來後面一堆圍棋AI小模型一下全出來了。純軟體你只是靠暴力解算力堆,人家自然有優化後的更好解法,沒看openai也在回頭做優化跟即時的深度運算280F 01/24 20:36
scitamehtam: 我兩種都下載,都有用,後來都用deepseek284F 01/24 20:36
eriker: 開始抹中黑了?285F 01/24 20:38

連國中英文都不會

還想在這邊大談

還嗆我去讀英文原文

中黑搞不好都不承認你是隊友

如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.=

kotorichan: 他能改用中芯晶片訓練更好286F 01/24 20:38
tsubasawolfy: 不然老黃幹嘛賣那台掌中型的AI機287F 01/24 20:39
CLinna: 國人捲出來的AI要打倒喝下午茶的工程師了嗎288F 01/24 20:39
poeoe: 那個英文很明顯在說15倍啦……289F 01/24 20:39
s0920151048: 這不能說中國好話290F 01/24 20:39
eriker: 造假就造假還在那護航292F 01/24 20:40
ilw4e: 好像很多人誤以為AI是哪家先搞出AGI就贏了,現實是就算搞出以後所有人知道該怎麼做很快就會用自己的方法一樣能跟上,效率更好成本更低293F 01/24 20:40
tsubasawolfy: 另外推特翻譯那個GOOGLE翻得沒錯296F 01/24 20:40
shorty5566: 他訓練還是要基於nv的gpu 用中芯的怎麼訓練297F 01/24 20:40
tomatobus: 笑了,原來尼的出處是那,還以為尼有什麼meta內部的消息298F 01/24 20:40
tsubasawolfy: 我覺得這比較像吹很久的edge AI踏出第一步300F 01/24 20:41
eriker: 那你抹中黑是怎麼回事?302F 01/24 20:41
appledick: 好啦 假的啦 造假啦 中黑贏了 可以吧303F 01/24 20:41

那個英文能力在這邊大談

強烈建議看看eriker的推文真的超好笑

eriker: 這樣是ok的 我都在講deepseek304F 01/24 20:42
bj45566: 無腦中黑在眾人面前證實了自己連簡單的英文都看不懂胡扯亂翻譯,嘻嘻 wwww wwww305F 01/24 20:42
poeoe: Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次307F 01/24 20:42
tonyshan: 簡體的可以SKIP了309F 01/24 20:42
good5755: 關鍵字:開源程式碼310F 01/24 20:42
appledick: meta 484太多冗員了啊311F 01/24 20:43
Fegnzi: 那些反智的人看不懂開源是什麼沒辦法,逢中就反真的沒救312F 01/24 20:43
eriker: 所以質疑deepseek造假就是中黑?314F 01/24 20:43

可以質疑的

不過哥你的行為真的相當反智

跟中國人民說祖國疫苗No1差不多 只是顏色不一樣而已

都是避著眼睛只相信自己相信的

distantblc: 急了315F 01/24 20:44
eriker: 只會做人身攻擊316F 01/24 20:44
scitamehtam: 質疑? 不是不行吧,要合邏輯…317F 01/24 20:44
eriker: 你在繼續318F 01/24 20:44
scitamehtam: 不然不就變成抹屎?319F 01/24 20:45
littenVenus: 這次中國真的會贏2次喔320F 01/24 20:45
appledick: deepseek如果不是中國研究我覺得你應該就不會質疑了321F 01/24 20:45
VicLien: 中國的天賦點在紅海化 厲害了322F 01/24 20:45
bj45566: 胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英文)說是無腦都還太客氣了好嗎? wwww wwww323F 01/24 20:46
appledick: 中國某些地方真的就是強啊 當然某些地方是不敢恭維325F 01/24 20:46
scitamehtam: 先玩過再說..,我兩套都玩過,deepseek真的不錯326F 01/24 20:46
eriker: 如果deepseek不是中國的還會這樣罵人嗎?327F 01/24 20:46
scitamehtam: 小心釣魚,看他自己表演就好,建議啦
沒邏輯的講話最大聲328F 01/24 20:47
eriker: 我沒差 反正我不會罵人 我只評論deepseek330F 01/24 20:48
scitamehtam: 最近這版衛兵執勤很認真,桶了幾波了,自己小心331F 01/24 20:48
epephanylo: (看戲332F 01/24 20:48
eriker: 反倒是某些人小心333F 01/24 20:48
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43
bj45566: 評論?胡亂翻譯人家的英文也敢叫做評論?笑死人有夠好笑 wwwww334F 01/24 20:49
Kazetachinu: 一堆ai大老都中國人 哪天超車都不意外 軟體這種東西限制沒有硬體這麼多336F 01/24 20:50
asjh612: 不過這篇推文這麼火熱 沒半個人貼實例對話XDD338F 01/24 20:50
brella 
brella: 垃圾新聞339F 01/24 20:50
asjh612: 之前gpt在紅的時候 還有gpt幫忙回應的截圖
覺得好的 可不可以務實點 去玩幾個例子貼來看看340F 01/24 20:50
yueayase: 大驚小怪,這種前沿的技術,本來就是湖鄉合作,及互相競爭的342F 01/24 20:51
asjh612: 讓我見識見識哪些是你們覺得好 哪些是回應差的344F 01/24 20:51
duriamon: deepseek有手機app啊!自己下載來用用看不就知道了?用email就可以註冊了。346F 01/24 20:52
yueayase: 湖鄉=>互相348F 01/24 20:52
scitamehtam: 剛好今天才在用..
反倒是批評的?….349F 01/24 20:52
holebro: 中國軟體強度上下限差很大 遇過一堆中國客戶連用AI幫忙寫sql寫shell script寫yaml都不會= =351F 01/24 20:53
scitamehtam: 我兩套都常用啦,我自己112csie,也有研究ai主題353F 01/24 20:53
kakiandkaka: 笑翻,被反向354F 01/24 20:53
duriamon: 樓上可以要他用正體中文回答。355F 01/24 20:53
 
scitamehtam: 倒是爬蟲後,發現一堆嘴的頭頭是道,結果背景令人驚訝XDDD358F 01/24 20:53
ezreal1315: 這就是第一個開頭的和跟班的差距啊 第一個一定要砸大錢開發 後面的當然可以降低成本360F 01/24 20:54
asjh612: 就是不想註冊阿... 試想會黑的怎會想用362F 01/24 20:54
scitamehtam: 沒用過說的好像很熟一樣XDD 實事求是XDD363F 01/24 20:55
ezreal1315: 哪個行業不是這樣 開拓者都是要付出最多的364F 01/24 20:55
s213092921: 問題是開拓者能否一直保持領先優勢,看看Nokia跟Mot365F 01/24 20:56
scitamehtam: 所以我說,爬蟲後的心得,就是推文自己小心,最近審查異己言論很勤勞的366F 01/24 20:56
s213092921: o蘿拉的下場368F 01/24 20:56
asjh612: http://i.imgur.com/LdGLuCI.jpg 看起來也有回答到?369F 01/24 20:56
NCUking: DeepSeek是猛在CP值超級高370F 01/24 20:56
TIPPK: 台灣軟體公司好少371F 01/24 20:56
bj45566: 連註冊都沒有就拼命在黑? wwww 人家台大資工親自試用還截圖給你耶372F 01/24 20:57
NCUking: OpenAI 目前還是領頭羊沒問題374F 01/24 20:57
zebra101: 笑死,人家明明在說META用了15倍的預算,更好的GPU375F 01/24 20:57
guanting886: 我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱376F 01/24 20:57
zebra101: ,卻訓練出了比DS更差的模型,英文到底怎麼讀的,could have看不懂嗎?377F 01/24 20:57
NCUking: 台灣搞LLM只能玩微調套皮379F 01/24 20:57
ezreal1315: 所以說 買大盤真安心啊 20年前市值前10公司跟現在比已經大洗盤380F 01/24 20:57
deangogi: 所以上面eriker說的meta復現準確度 有原文嗎?382F 01/24 20:58
scitamehtam: 我平常兩個都在玩啊,我沒說chatgpt不好吧?383F 01/24 20:58
duriamon: AI領域大陸那邊跟美國的差距本來就不大,有在關心AI相關研究的大概都知道在說什麼,尤其中文大語言模型就唯一只有大陸那邊的能打,反觀台灣研發的真的很爛,呵呵!384F 01/24 20:58
eriker: 沒有 嘻嘻388F 01/24 20:58
symeng: 暫時觀望389F 01/24 20:59
asjh612: 你問他llm吹很厲害的 有多少在搞啊 誰有空每個都試390F 01/24 20:59
ezreal1315: 我覺得不用太緊張啦 人家用H800真的能超越openai391F 01/24 20:59
deangogi: 你說的如果是原po貼的那段翻譯 應該是你翻譯的問題392F 01/24 20:59
ezreal1315:  我相信股價早就被灌下來灌爛了 那些大戶一定第一個跑的393F 01/24 20:59
zebra101: 那個eriker連最基本的英文都讀不懂395F 01/24 20:59
aac219oo: 我看有很多人都不知道自己用的網站是用vue3寫的396F 01/24 20:59
w300204: costdown誰的比得過華人397F 01/24 21:00
NCUking: 中國軟體實力本來就是天下第二了398F 01/24 21:00
abc21086999: https://i.imgur.com/fo3jbRR.png
中國特色社會主義式的AI399F 01/24 21:00
ezreal1315: 或者是就算如此 巨頭也不會降低支出 怕被同行超越401F 01/24 21:01
Samurai: 先不說是不是真的,但逢中必反那個鳥樣,酸別人砸錢研發有夠莫名其妙402F 01/24 21:01
asjh612: copilot claude gemini gpt llmam 每個新出的都sota404F 01/24 21:01
duriamon: 還有人以為是costdown啊?不虧是台灣代工老舊代工思維,那些發展AI的人才經費花費成本真算下來哪裡costdown了?405F 01/24 21:01
abc21086999: Gemini thinking 答的就沒問題
https://i.imgur.com/bQT9dQz.png408F 01/24 21:02
gstym: 中國晶片都可以去買別人的晶片來磨改名字了==410F 01/24 21:02
scitamehtam: 說真的chatgpt也能回答這題XDD411F 01/24 21:02
asjh612: 搞不懂別人的問題點 還在以為我在黑中國412F 01/24 21:03
duriamon: 台灣的老問題上次已經講過了,目前全世界先進的未來科技領域除了「我們有台積電」之外每一個能打的。413F 01/24 21:03
scitamehtam: 但好笑的是,拿這題當評斷AI的標準XDD415F 01/24 21:03
asjh612: 問題是 現在每個llm都吹自己最強 當我是llm測試員哦416F 01/24 21:03
scitamehtam: 很顯然不是理工人吧XD417F 01/24 21:03
Mytsb2421: 美國變成copy cat418F 01/24 21:04
iaminnocent: deepseek不採用預標數據集(也就是先由人類標記數據再給模型訓練)而是直接採用強化學習,自己訓練自己,並且透過他們的局部Token啟動機制,可以減少使用量,這也是為什麼Deepseek能夠大幅降低訓練成本的原因,不確定OpenAi 或是其他AI模型,為什麼沒有進行強化學習419F 01/24 21:04
scitamehtam: 所以才說,爬蟲後,再看一次推文會很有趣啊XD 另,你知道ptt主機放哪?XD425F 01/24 21:04
Samurai: 意識形態死腦筋沒救,拿六四事件當評斷AI標準XD427F 01/24 21:04
s213092921: 因為美國只相信大力出奇蹟那套,砸錢砸算力429F 01/24 21:05
Lenney33: 成本更低 美國科技巨頭情何以堪430F 01/24 21:05
iaminnocent: 但是這確實是對AI界投下震撼彈吧,不過OpenAI改用自主強化學習,不知道是否可以431F 01/24 21:05
abc21086999: 理工人又在打手槍自慰啊
會審查訊息的AI就算在某方面超越其他人也是不可能普吉的
*普及433F 01/24 21:06
tw77769: 阿姨的機會來了437F 01/24 21:06
iaminnocent: DEEPSEEK 的數據集也許確實有部份來自ChatGPT,但這並不影響他確實是一個蠻厲害的模型438F 01/24 21:07
bj45566: 又有人硬要扯到晶片了。公開的論文告訴你實驗環境、算法流程、效能評比;原始碼放在大家都可以下載的 GitHub 上,這要怎麼作弊???440F 01/24 21:07
scitamehtam: 就事論事,如果你說會不會普及,那就另外一題了,請另闢蹊徑吧443F 01/24 21:07
a558815: Deepseek 是真的有些東西啊445F 01/24 21:07
tsubasawolfy: OPENAI的O3就是RL壓 聖誕節前的13天倒數也有RL出現O3就是O1 RL來的 省去訓練成本446F 01/24 21:08
ggbi4zzz: 美國人都害怕被中國ai超越,還有中國黑認為是在吹牛逼而已448F 01/24 21:09
minazukimaya: 還好它開源 同樣的演算法創新讓資源更多的美國科技巨頭來用 以他們握有的訓練資源能產出更驚人的結果450F 01/24 21:09
s213092921: http://i.imgur.com/vaz7qmE.jpg 誰抄誰啊嘻嘻452F 01/24 21:10
eett811025: 碼農996用肝跟你拼了453F 01/24 21:10
bread1110: 這鯨魚真的邪門 花少少的預算幹大事 meta最好撐住啊454F 01/24 21:11
minazukimaya: 但感覺AGI和技術奇點的時間又被提前了.......455F 01/24 21:11
s213092921: 中國AI公司因為算力受限,只好動腦另闢蹊徑,走出一片天,高階晶片也是一樣的道理456F 01/24 21:11
qazwsx0128: 夠便宜我就自己訓練一個458F 01/24 21:11
minazukimaya: 這才是最恐怖的吧 感覺2030年前就要奇點了459F 01/24 21:11
iaminnocent: 那就對啦O3開始用RL的話,大概又會反超吧460F 01/24 21:12
fywei:  真的好恐慌 zzz 嚇死人 只好再睡一下461F 01/24 21:12
nfsong: 開源的  只能導入462F 01/24 21:12
ishdtt598: 跟文組講那麼多幹嘛 笑死463F 01/24 21:12
nfsong: 論文都出了464F 01/24 21:12
eliteark: 繼續吹起來 我要看到血流成河465F 01/24 21:13
LBJshit: 傻鳥真的很傻很北七 一直那邊說DS造假 我還以為是真的有什麼內幕勒。結果他媽的是英文太爛根本自己完全466F 01/24 21:13
nfsong: 跟股票一樣  有錢人不會輸468F 01/24 21:13
LBJshit: 搞錯 連下面有中文的正確翻譯也不看469F 01/24 21:13
nfsong: 導入以後 3000e 的就更猛470F 01/24 21:13
cay86714: AI究極鬼故事!471F 01/24 21:14
nfsong: 550萬就這麼猛  3000e的 6倍猛472F 01/24 21:14
iaminnocent: 那個貼文確實是說Meta的訓練費用都可以訓練15次Deepseek了473F 01/24 21:14
shorty5566: 傻鳥真的北七 前幾天還看到黃仁勳去中國就瘋狂崩潰475F 01/24 21:14
duriamon: OpenAI的問題是核心科學家走了477F 01/24 21:14
gn7722: 就跟現在的預算一樣478F 01/24 21:15
iaminnocent: O3我記得之前altman有貼出他的比較,好像比O1強不少,但是當然費用很貴,如果OpenAi把這個開源的機制拿來用不知道行不行479F 01/24 21:15
cay86714: 如果這是真的那麼那些CSP之後的資本支出根本不用那麼高嘻嘻482F 01/24 21:16
g27834618: 訓練費降低是利多啊 趕緊出殺手級應用才是正軌484F 01/24 21:16
littenVenus: 老黃484蛋雕惹QQ485F 01/24 21:17
duriamon: 訓練費代表所需的時間成本、算力跟電費等,自己想想看囉!486F 01/24 21:17
littenVenus: 電力需求應該也不用那麼多吧488F 01/24 21:17
cay86714: 不過這件事沒多久前國內投資圈就有一些人知道了,就看市場什麼時候反應了嘻嘻489F 01/24 21:18
iaminnocent: OpenAI比較像是他有很多資訊,當你詢問他時,他會依據他的知識庫中去找尋資料,並且給你。DEEPSEEK則是有很多專門的朋友,會依據問的問題,分配給適合的專門朋友去找資料回答(也就是不會全部Token調動,可以減少Token使用量)491F 01/24 21:18
beesee: 訓練方式很華人496F 01/24 21:19
littenVenus: 窩是上禮拜看節目聽一個物理學博士在分析497F 01/24 21:20
Samurai: 老黃沒差吧,算力永遠不夠,相同算力能做的事情更多了,加速科技發展,是軟體公司要頭痛了,拼肝拼軟體效率拼不過華人498F 01/24 21:20
s213092921: 國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek邏輯模型XDD501F 01/24 21:20
usereminem: 一堆人仇中仇到腦子壞掉了 可悲503F 01/24 21:20
yusanhu: 厲害504F 01/24 21:21
littenVenus: DS是分區塊 各領域專門訓練505F 01/24 21:21
duriamon: 沒錯,deepseek是MoA架構。506F 01/24 21:22
minazukimaya: 演算法創新會反過來創造出新的算力需求啊 因為對智能的追求沒有上限 更高效的演算法=更快到奇點507F 01/24 21:22
tw19930419: 一堆低能中黑 看了就好笑509F 01/24 21:23
ilw4e: 哈哈黑黑不知道一堆模型都會說他是chatgpt,因為監督學習步驟最多人用的就是拿chatgpt當那個監督模型510F 01/24 21:24
s213092921: https://b23.tv/R7tEm3q512F 01/24 21:24
cosmite: 剛問了美國地47屆總統是誰,連這個都答不出來,資料庫還停在2023(模型為DeepSeekV3)
https://i.imgur.com/XXmbi1v.jpeg513F 01/24 21:24
bj45566: OpenAI o3 是非開源碼啊,而且最近被揭露它表現最驚人的 FrontierMath 指標有作弊的嫌疑!相關的英文報導和討論不少,這裏給一個實例!
https://tinyurl.com/yw55fcwk516F 01/24 21:24
OpenAI Secretly Funded Benchmarking Dataset Linked To o3 Model
OpenAI secretly funded and had access to a benchmarking dataset, raising questions about high scores achieved by its new o3 AI model. ...

 
cosmite: ChatGPT-4則沒有問題
https://i.imgur.com/oGA0Blp.jpeg520F 01/24 21:25
fattyeddie: 連ai都能卷 了不起我的國522F 01/24 21:26
bj45566: P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來吶喊丟人現世 wwww wwww523F 01/24 21:26
duriamon: 因為deepseek不用運轉那麼多參數來產生回答,而OpenAI的必須要,所以以電力消耗、算力消耗跟微型化來說都不利,但也不是代表這樣不好。我是覺得OpenAI自從變成Altman的玩物之後,進步幅度有限,反而吹噓成分增加了,呵呵!525F 01/24 21:26
minazukimaya: DeepSeek有價值的地方不是它自身模型有多強..
而是他提出的創新可以被其他有更大訓練集和更多算力530F 01/24 21:26
KOKEY: 差別在喝的茶葉或咖啡比較貴啦532F 01/24 21:27
minazukimaya: 的公司複用533F 01/24 21:27
duriamon: 強的是訓練的方式,裡面的秘密我相信應該沒有開源,呵呵!534F 01/24 21:27
bj45566: 現在面臨作弊醜聞的反而是美國 & 世界最強的非開源碼 OpenAI o3536F 01/24 21:28
DCapple: 又贏了又贏了,中国贏兩次538F 01/24 21:28
tw19930419: 那叫做他沒有使用網路 不是他不會 問這種沒鑑別度的蠢問題要證明什麼539F 01/24 21:28
Samurai: 不要再搞笑了,他的資料庫到2023年根本就不是什麼缺陷,只差在有沒有網路搜尋最新資訊而已541F 01/24 21:29
minazukimaya: DeepSeek很公開啊 演算法和工程改進都寫在論文裡543F 01/24 21:29
littenVenus: 那個博士認為 因為成本優勢 注定美國以外地區會傾向DS 所以DS將是最後贏家544F 01/24 21:29
minazukimaya: 真的是還好它夠公開546F 01/24 21:30
raygod: 加大制裁547F 01/24 21:30
minazukimaya: 不過它也是站在一堆前輩肩上 現在給人站肩膀 這就是548F 01/24 21:30
Samurai: 意外的是DS竟然這麼大方公開研究方法549F 01/24 21:30
minazukimaya: 科學研究啊550F 01/24 21:30
runacat: 論文都出來了551F 01/24 21:31
QuuEgg: 哇啊,削價競爭欸552F 01/24 21:32
bj45566: DeepSeek 如果在演算流程上沒有開創性的突破,美國業界大老絕對不會用 "breakthrough" 來形容啦,這個字義和 "cost down" 或  "內卷" 相差十萬八千里 -- 而且 " cost down" 是標準的台式英文553F 01/24 21:33
wchang: 好到不可思議的好,就是假的
跟運動員吃禁藥一樣,不是apple 對apple557F 01/24 21:33
Mosskappa: Buy the rumor559F 01/24 21:34
tpkgo: 讓子彈飛一會兒~~~~560F 01/24 21:34
minazukimaya: 令人恐懼的反而是模型的效率一日千里 對齊的研究牛步慢行...
根本是直通文明毀滅的最短路線XD561F 01/24 21:35
tonyshan: 看起來就改進一個東西 就吹到天上去564F 01/24 21:36
minazukimaya: DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格565F 01/24 21:36
tompi: DS API的費用是 o1 的1/30566F 01/24 21:37
minazukimaya: DeepSeek可不止改進一個東西 論文都有 白話技術文也567F 01/24 21:37
tsubasawolfy: 不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬568F 01/24 21:37
bj45566: 樓上是在說 OpenAI 的 FrontierMath benchmark 嗎?好到不可思議結果...569F 01/24 21:38
duriamon: 沒辦法,讓AI對齊人類的道德沒辦法賺錢,呵呵!571F 01/24 21:38
mamorui: 這個應該不怎樣吧  去年看太多篇宣稱更頂 驗證一下572F 01/24 21:38
tpkgo: 中國很會利用別人的研究偷雞 先聽聽就好573F 01/24 21:38
mamorui: 就沒戲了 @@574F 01/24 21:38
tsubasawolfy: 斯克一心想上火星一樣 賽道不同575F 01/24 21:38
minazukimaya: 有 至少在大膽創新+高效工程這兩方面是非常優秀的576F 01/24 21:38
wsung: 已經玩了一整天的R1,真的不差577F 01/24 21:38
mamorui: 去年一堆 現在不是很愛看中國出的論文 拿到長官面前介紹都容易被罵578F 01/24 21:38
bj45566: 人家原始碼、論文跟效能測試結果都公佈了啊,請問樓上舉例一下哪個說自己更頂的有公開這些?好酸的葡萄 wwww580F 01/24 21:41
minazukimaya: 中國一堆騙錢公司是事實 但DeepSeek和他們不一樣也是事實 這兩個事實又不衝突...583F 01/24 21:41
mamorui: 不是啊  論文就是有新方法 數據更漂亮 但實驗效果跑了不佳 真的有啊585F 01/24 21:42
NTUCS: 藍白糞高潮587F 01/24 21:43
bj45566: 樓上中黑請解釋一下人家論文、原始碼都公開的情況下要怎麼「利用別人的研究偷雞」?只會無腦黑嗎?588F 01/24 21:43
naushtogo: 最近炒作很大,讓我們繼續看下去590F 01/24 21:43
mamorui: 我找一下 我有標記過591F 01/24 21:43
s800525: 說減少算力能達到一樣效能,那一樣算力不是能達到更高效能?為何要以減少算力為前提?592F 01/24 21:43
NTUCS: 論文公布了 但能 repro 嗎594F 01/24 21:43
bj45566: 請問有哪個可信消息來源說「實驗結果不佳」?又在自己腦補嗎?595F 01/24 21:44
tpkgo: 原始碼公開又不代表什麼  你是沒看過原始碼公開喔!!597F 01/24 21:44
NTUCS: 你不是藍白糞幹嘛入座598F 01/24 21:44
mamorui: 啊 像那個LLaMA-omni就是同事報告時直接露餡599F 01/24 21:45
s800525: 說能事半功倍,那不能事倍功四倍嗎?600F 01/24 21:45
mamorui: 開源就可以去repro601F 01/24 21:45
vtgc161: 論文出來了,所以有人可以說明一下,他到底是不是拿現有Ai模型為底去訓練的嗎602F 01/24 21:47
mamorui: 要跑過才知道604F 01/24 21:47
bj45566: 原始碼公開多久了?美國頂級業界學界大老也高度評價讚賞,台大資工板友也早就註冊測試覺得表現很好了 -- 請問中黑還要怎麼樣才願意承認人家做出一個好東西???605F 01/24 21:48
mamorui: 等哪天這個技術在公司一堆人講才是真的 我現在沒聽到就是了609F 01/24 21:48

你公司如果在做AI模型研究/工程的

這幾天全公司上下應該都在研究這個

duriamon: 簡單來說就是最近有一個新的AI能力測驗,找了好幾位費爾茲數學獎得主來出超高難度題目,幾乎所有AI模型都回答得跟屎一樣,只有o3脫穎而出,大家正震驚OpenAI的技術力時,被爆料出來因為這個AI能力測驗OpenAI有贊助能事先拿到題目作弊,Altaman的作為我是不意外啦!呵呵!611F 01/24 21:49
minazukimaya: 你現在沒聽到要啟MoE項目 只是表示你公司不在最前沿617F 01/24 21:49
cclemon1231: 對岸弱點還是0到1,但改造能力真的很強618F 01/24 21:49
bj45566: 看來你待的公司比 Meta AI 還強 wwww wwww619F 01/24 21:49
sleepinggod: 成本低,跟使用者收費就可以便宜620F 01/24 21:50
mamorui: 因為老馬的之前也拿過高分。就看囉621F 01/24 21:50
yunf: 機器之心 是誰?622F 01/24 21:51
minazukimaya: 現在最前沿的美國公司一定會啟新項目投入MoE方向了623F 01/24 21:51
good5755: 分領域導出答案 假如問題是跨領域不就GG了624F 01/24 21:51
mamorui: 沒有啊 大家也是會謹慎看結果 OpenAi在很多篇論文數據都平均佳 所以謹慎看待每一版表現囉625F 01/24 21:51
davis5566: 說個事實  某些人就開始藍白粉壯世代的  這些爛貨還是早點被時代淘汰吧627F 01/24 21:52
mokipu: 拉板凳看戲629F 01/24 21:52
dwood123: 這說明小公司也可作出好的模型,那大家就會躍躍欲試,Al伺服器需求也會增加啊!630F 01/24 21:52
duriamon: 其實MoA架構比較符合人類的思考方式,人類大腦功耗632F 01/24 21:52
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14
duriamon: 才30W參數量才4GB,演化的威能不是蓋的。633F 01/24 21:52
sleepinggod: 台灣不應該發展中文語言模型,教授都嘛拿國家錢產出沒用的東西。直接全民學英文比較有效率634F 01/24 21:53
bj45566: duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉弊醜聞我在樓上就貼了一個應為報導短網址了,現在 AI 圈內最被懷疑的反而是這個636F 01/24 21:53
good5755: 而且重點是資料庫吧 目前以資料庫取得難易程度639F 01/24 21:53
duriamon: 有Altman亂搞,OpenAI遲早會完蛋,我先預言在這邊,640F 01/24 21:54
good5755: 對岸的13億免費資料庫真的比歐美簡單多了641F 01/24 21:54
duriamon: 呵呵!642F 01/24 21:54
mamorui: 我記得OpenAI數學不好吧643F 01/24 21:54
bj45566: *英文報導644F 01/24 21:54
tpkgo: Meta AI不錯 但現在使用者標竿是OpenAI645F 01/24 21:54
akwa: 一堆井蛙還是不信 呵呵646F 01/24 21:54
bj45566: 難怪你待的公司沒人在討論 DeepSeek,都 2025 年了還在講 OpenAI 數學不好,嘻嘻 wwww wwww647F 01/24 21:55
mamorui: 對 OpenAI是標竿 因為大多比較數據出在別人的論文裡 GPT都平均拿到最佳 但數學是真的爛649F 01/24 21:55
bj45566: OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 FrontierMath benchmark !!!651F 01/24 21:56
duriamon: 現在由於用於訓練AI模型所使用的開源資料已經幾乎耗盡,現在流行的是新型AI架構的研發以及超參數的蒸餾和分析,如何從已經有的超參數產生更好的產品才是顯學。653F 01/24 21:56
mamorui: 我是沒有很常使用數學相關的沒錯。記憶停在數學爛沒錯657F 01/24 21:56
sweetantt: o3應該不久後就會出來了吧 而且免費用戶也有o3 mini 到時候就知道openAI有沒有吹牛了659F 01/24 21:56
duriamon: 看那個整天吹噓的Sora我是不期待啦!呵呵!661F 01/24 21:57
bj45566: 還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾壓你好嗎!662F 01/24 21:57
cityhunter04: 叫美國時代過去之前,他科技還是屌打世界2-30年…664F 01/24 21:58
duriamon: 新的架構我覺得會是比較有趣的發展,傳統的transformer已經差不多了。
說是傳統不過也才2-3年的事,AI發展就是這麼競爭,呵呵!665F 01/24 21:59
mamorui: 等很多paper報告看到比較時DS贏再說吧  最近兩個月沒時間看paper 小組報告都延期了 趕年末案子要GM669F 01/24 22:00
bj45566: OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好嗎?671F 01/24 22:05
mamorui: o3不是12月才推出嗎 我剛好沒用 哈  以前很爛是真673F 01/24 22:07
Tsukasa0320: 很好啊 有威脅度才有理由打死675F 01/24 22:07
mamorui: 那我就期待一下2025的各大paper囉676F 01/24 22:07
bj45566: OpenAI o3 現在被質疑的 FrontierMath benchmark 是絕大多數人一輩子都碰不到的高等數學677F 01/24 22:07
k798976869: meta就是故意開源AI不給微軟賺的 還在演啥679F 01/24 22:08
bj45566: 又在講笑話了,嘻嘻。OpenAI 在 AIME benchmark 早就超過大部分人的數學水準了 wwww680F 01/24 22:09
popo123456: 丸子,台積和美股7巨頭都要暴跌682F 01/24 22:10
bj45566: 難怪你的公司沒聽過 DerpSeek,嘻嘻 wwww683F 01/24 22:10
mamorui: 教科書的數學是可以 邏輯陷阱還是會踩
聖誕節才發布 不要急哇684F 01/24 22:10
DA3921999: 只要中國的開發者還開源就不可能贏美國啦,美國穩的686F 01/24 22:12
lon0623: 暴跌就想太多了,尤其台積本益比才二十幾687F 01/24 22:12
bj45566: 開源的遠不只 Meta 一家,DeepSeek 是用少得嚇人的成本打平、打敗檯面上所有的開源大語言模型688F 01/24 22:12
shorty5566: NV盤前大跌-0.5% 蒸的丸子690F 01/24 22:13
abc21086999: 為什麼有人要為了中國的AI很厲害感到自豪?691F 01/24 22:13
lon0623: 你問中國用的晶片是不是台積做的692F 01/24 22:14
mamorui: 我也不知道 而且我習慣謹慎多看幾版693F 01/24 22:14
lon0623: 而且AI只是台積的一部分而已694F 01/24 22:14
MumiPyonPyon: Deepseek不是open的嗎@@695F 01/24 22:15
bj45566: 因為 DS 狠狠打臉股板數不清的無腦中黑啊,嘻嘻 wwww
連 OpenAI 數學早就很強都完全不知道的人說自己「謹慎」 wwww wwww
看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧 wwww696F 01/24 22:16
loveyou9527: 兄弟 聽我說 這個ds 有料702F 01/24 22:21
yunf: 真的沒什麼好爭的 就看你能拿它來做什麼 有真的帶來創造性的價值 那就是對你有利的703F 01/24 22:21
lon0623: 料敵從寬也不是壞事阿,多多想台灣有什麼能介入的705F 01/24 22:22
yunf: 黑貓白貓會抓老鼠的就是好貓
如果他再厲害不能為你所用也是沒用706F 01/24 22:22
verydolungbe: 支那XDXDXD 聽聽就好708F 01/24 22:23
yunf: 謝遜拿了屠龍刀雙眼失明 頂多拿來砍樹709F 01/24 22:24
lon0623: 中國景氣不好有時對科研反而有好處,逼人去研究710F 01/24 22:24
s800525: 有更好的算法能產生更快投入市場,就會有更多廠商願意堆更多硬體來搶佔市場,永遠沒人在嫌硬體效能過剩711F 01/24 22:24
heart9677: 想想半導體造假,先觀望一下好了714F 01/24 22:24
yunf: 沒有不好好嗎 每天那麼多人張口就是要吃飯
吃的用的沒少過 只是沒有以前這樣亂花715F 01/24 22:25
k91011022: 資料都被分析完 那就有可能走向預測了717F 01/24 22:25
mamorui: 很快的。論文1、2個月內會有一堆去證明。718F 01/24 22:26
lon0623: 連他們自己一堆人都在說景氣下行了,不用否認719F 01/24 22:26
s800525: 這個方法好,那當所有人都用這方法,那最後不是還是拚誰堆的硬體多?720F 01/24 22:26
knml: 自己去用用看不就得了,免費722F 01/24 22:26
lon0623: 要推廣給更多人用,還是要硬體阿
甚至能普及的話,硬體需求更多723F 01/24 22:27
mamorui: 是要看驗證數據 不同篇會用不同場景要解決的問題去驗證 我不可能自己去弄那個資料725F 01/24 22:28
s800525: 現在反而怕應用普及不了到一般消費者,硬體需求反而曇花一現,真能更快達到普及至消費端,硬體需求才真的會井噴727F 01/24 22:28
ab4daa: $$$$$$$$$$$$$$$730F 01/24 22:29
Rickyyy: 裁員滾滾,股價又可以噴噴731F 01/24 22:29
lon0623: 這就跟省油車出來,汽車反而賣更好的道理依樣732F 01/24 22:29
js52666: 小金庫被拆了733F 01/24 22:30
goal56: 中國人比較卷 贏美國早晚的734F 01/24 22:30
lon0623: H800 GPU不也是NV的嗎?735F 01/24 22:31
yunf: 半年整個指數漲了快¼你說經濟很差?736F 01/24 22:32
s800525: H800效果就很好,那用GB200不就飛天了?737F 01/24 22:33
minazukimaya: 模型是科研 應用是商業 其實這兩件事關連不大~~
商業上 還是擁有直接面對消費者布署能力和通路的巨頭們優勢最大738F 01/24 22:33
yunf: 1990年到現在漲了10倍741F 01/24 22:36
thigefe 
thigefe: 左等台積腰斬742F 01/24 22:36
s800525: 港股一年來漲了26.20%,但5年來跌了28.21%,所以說經濟不好沒問題吧?而且比疫情時期還低就更慘了...743F 01/24 22:37
yunf: 那只是一個相對的概念745F 01/24 22:38
lon0623: 中國政府都在催促國家隊進場買股了,這樣叫好?746F 01/24 22:38
yunf: 一個人如果有10億 然後他現在剩下七億每天跟你說他很窮 你要同情他嗎?747F 01/24 22:38
lon0623: 他們本來就不是正常股市了,做空還會被政府抓749F 01/24 22:39
yunf: 你可能沒有看過1990的大陸750F 01/24 22:40
lon0623: 1990的人忍耐力一定比現在高很多好嗎751F 01/24 22:40
Paulsic: 百萬輸出 tokens 16 元,輸出 API 價格只有 OpenAIo1 的 3%。熟悉的味道752F 01/24 22:40
yunf: 那時候他們就已經過得不錯了 只是沒有現在好而已754F 01/24 22:40
lon0623: 1990過得不錯是平行時空嗎?
現在一定比35年前好啦,但人民的需求也會上升755F 01/24 22:41
WD640G 
WD640G: 好啦 中吹先給你高潮757F 01/24 22:42
lon0623: 之前一直吹的解封行情,現在也沒了758F 01/24 22:43
yunf: 有吃有喝 有得住 還要怎樣? 就是交通不發達 醫療技759F 01/24 22:43
jamesjklin: 爛爆,deepseek錯誤百出760F 01/24 22:43
yunf: 術不發達761F 01/24 22:43
mamorui: 中國有些團隊paper提供無限量用很佛是真的 尤其gen多媒體 同事分享過 覺得挖paper最大好處762F 01/24 22:45
bj45566: 1. 中國現在經濟差景氣不好;2. 中國中下層百姓過得比疫情前還苦;這些都沒錯,但是:3. 中國投入科研的經費持續增加;4. 中國 2024 年在頂尖科學和、工程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp. Nature, Science764F 01/24 22:45
xkso: 中國東西 先打3折769F 01/24 22:46
JWJerryyy: 剛剛meta ath 看來不影響?770F 01/24 22:46
lon0623: 景氣不好,會讓一些人才寧願去科研阿771F 01/24 22:46
mamorui: 真得先打3折 QQ772F 01/24 22:46
shorty5566: 蠢鳥也很笨 這東西明明對台灣也好773F 01/24 22:48
holysong: 中國人很卷終獲勝?1990日本也過得不錯啊774F 01/24 22:48
yunf: 這都他們自己控制的775F 01/24 22:48
shorty5566: 要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎776F 01/24 22:48
lon0623: 中國民企要存活,基本上就是要走出海外777F 01/24 22:49
yunf: 過度信用擴張的人才會有問題778F 01/24 22:49
shorty5566: 有deepseek的發表 至少讓台灣還有入場券779F 01/24 22:50
lon0623: 不然國內越捲就越不敢請人,繼續惡性循環780F 01/24 22:50
newyorker54: 我只說一句如果真的那麼好,中國人完全不可能開源,對標open AI就只是滿足自卑感自己吹吹。完全沒有原創性的產品781F 01/24 22:50
jasterlin: 唬爛,沒底層光靠蒸餾要趕英超美784F 01/24 22:50
MrCool5566: 怎麽一堆人看到中國就黑785F 01/24 22:51
lon0623: 美國最大優勢其實還是強大的內需
那些中國公司產出在好,不進歐美會被自己人卷死786F 01/24 22:52
narotic: 都是中共同路人啦788F 01/24 22:54
newyorker54: 大家還不夠瞭解中國人嗎?又狠又卷又不要臉,文革大躍進死的人比二戰還多,把錯都推給毛澤東,那根本是一個全體人民劣根性的完全展現結果,只怪一個人??789F 01/24 22:54
yunf: 中國會沒有內需嗎? 而且四倍的人口793F 01/24 22:54
lon0623: 問題是他們的對手也是中國公司啊 自己人卷死794F 01/24 22:55
newyorker54: 有人還抹我是中國同路人,笑死!中國六代戰機有開源嗎?但是中國人也不要偷著樂,六代機和老美十幾年前就有的F22也不會有優勢,看有沒有五五波就偷笑了795F 01/24 22:57
bj45566: 都被美國業界學界大頭稱讚是 "breakthrough" 了還在「完全沒有原創性」,笑死 wwww 講這句話的人根本不懂什麼什麼叫作原創性798F 01/24 22:58
yunf: 原本就太肥了 nv的算力可能撐不起他們那種演算法
沒差就看誰先算出有用的東西801F 01/24 22:58
newyorker54: 中國是變強了,是世界第二強國,但是民族劣根性永遠去除不掉803F 01/24 22:59
bj45566: 而且中國領先的 AI 公司的語言模型幾乎都是開源讓大家下載,遠不只 DS,一點常識都沒有 wwww wwww805F 01/24 22:59
Paulsic: 看效能和背後的財務模式不覺得恐怖嗎807F 01/24 23:00
iaminnocent: Deepseek的模型有借鑒之處,美國人也不是白癡,學過來調整一下,馬上模型就降本增效了808F 01/24 23:00
bj45566: 美國、歐洲大部分做 AI 研究的也是開源,OpenAI 反而是世界的少數例外810F 01/24 23:00
iaminnocent: 真的OpenAI 真的反而是例外812F 01/24 23:01
newyorker54: 老黃還稱讚華為手機不可思議,中國人不要那麼自卑好不好?? 等到學界公認再來說吧813F 01/24 23:01
lon0623: 說不定是美國人過太爽了,人事費用太高815F 01/24 23:02
lusifa2007: 如果deepseek可以搞到gb200 不是更強 AI永遠需要NV816F 01/24 23:02
bj45566: 現在 AI 還是離起跑點不遠的階段,當然最後美中誰贏不知道,更有可能是互有擅場818F 01/24 23:02
yunf: 你看你能不能算出一個 比馬斯克更棒的火箭系統820F 01/24 23:02
lon0623: 看一堆影片還說美國科技業過多爽821F 01/24 23:03
Paulsic: 付費打不過open還有人要付錢822F 01/24 23:04
capser: 推開源823F 01/24 23:04
minazukimaya: 組織文化的問題 DeepSeek作得到但是華為騰訊百度沒作到 就說明了這不是中美差異 而是組織文化差異824F 01/24 23:04
yunf: https://tinyurl.com/283v9oe3826F 01/24 23:04
iaminnocent: Deepseek的強化學習模式,也是O3的訓練模式,所以等O3公布以後,大家應該又會來比拼827F 01/24 23:05
newyorker54: open AI算力爆棚錢又多,窮人用窮人演算法自己自嗨!笑死。大腕花幾十萬玩明星一次,窮人打手槍打到扁掉,還很得意說不花錢還射比較爽,哈哈829F 01/24 23:05
minazukimaya: 要論軟工高手和996的強度 中國大公司比DeepSeek強多832F 01/24 23:05
yunf: 的確是很爽 但是壓力也很大 而且整個人的思路都不一樣了833F 01/24 23:05
minazukimaya: 了 這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功自然有其公司文化的獨特之處835F 01/24 23:06
epicurious: 重點是沒有要比美國好啊,差一點點但便宜5倍,美國csp廠capex砍下來供應鏈就崩了837F 01/24 23:08
bj45566: 看某位美國一流名校女博士天天拍 YouTube 就知道美國高科技業一堆爽缺閒缺...839F 01/24 23:08
newyorker54: 真正開源的是meta,DS也是拿人家的來改根據開源條款本來就要跟著開源,中國人有那麼好死,講一個自己完全無到有的原創產品開源的再來說自己人格很崇高,不然看你中國人德行就是垃圾841F 01/24 23:10
lon0623: 女博士薪水說不定比台積很多主管高了845F 01/24 23:10
bj45566: 真的不用拿文革和大躍進來嘴什麼民族性,要不然美國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英國帶頭都禁止蓄奴了)?? ?846F 01/24 23:11
shorty5566: 砍capex幹嘛 好的模型算法+算力不是更飛天= =
除非你覺得AI已經發展到盡頭了 不然算力永遠都不夠849F 01/24 23:11
lon0623: 美國有些人事成本真的太高了,還有搞啥DEI851F 01/24 23:12
minazukimaya: 對啊 算法改進了效率變好 第一直覺當然是再放大模型852F 01/24 23:12
shorty5566: 好的算法+更強的算力那才是事半功倍 買越多省越多853F 01/24 23:13
minazukimaya: 或是再加訓練集吧 對BigTech來說...854F 01/24 23:13

--