看板 Stock
作者 exeex (人非腎鹹)
標題 Re: [新聞] 與台積電不一樣!馬斯克公布地表最大晶
時間 Tue Mar 24 14:56:11 2026


先別管晶片廠怎麼蓋
先來看一下老馬之前晶片設計怎麼翻車的

先貼個tesla dojo 2砍掉的新聞
https://techorange.com/2025/08/08/tesla-dojo-shut-down/
馬斯克賭輸了?特斯拉 Dojo 計畫失敗,核心團隊出走成「新敵手」 | TechOrange 科技報橘 特斯拉(Tesla)近日將解散由 Peter Bannon 領導的 Dojo 超級電腦團隊,宣告停止自主開發無人駕駛 AI 晶片的計畫。 ...

 


技術細節參考

https://electrek.co/2022/08/24/tesla-deep-dive-presentations-dojo-ai-supercomputer/
Tesla releases new deep-dive presentations on its Dojo AI supercomputer | Electrek Tesla has released two new deep-dive presentations into its Dojo AI supercomputer ahead of its upcoming AI Day 2. You... ...

 

https://chipsandcheese.com/p/hot-chips-34-teslas-dojo-microarchitecture


他的架構是這樣



用354 riscv core組成一個die

再用25個die組成一個tile

最後tile組成運算節點

但這樣有個問題

他設計的功率密度太高 需要上水冷

然後die size很大 又要考慮壞點容錯

die to die也要考慮path失效的容錯



但不是只有晶片良率的壞點

高熱長期運轉本來就會經常掉點

尤其是這種大規模運算叢集

比如meta這篇

https://engineering.fb.com/2024/06/12...language-models-at-scale-meta/
How Meta trains large language models at scale - Engineering at Meta As we continue to focus our AI research and development on solving increasingly complex problems, one of the most significant and challenging shifts w ...

 

練LLM基本上都在和節點失效搏鬥




神經網路的整個訓練流程

只要一個bit翻轉都有可能把整個訓練殺死


(梯度下降算法,錯誤會隨梯度傳播到整個模型)


他的技術只有考慮靜態失效

也就是練到一半突然壞一個core是無法處理的

(因為他的軟體根據晶片壞哪裡,去編譯出繞過壞點的程式
壞點必須事先知道)


不管你dojo 2算力多少,訓練流程跑不完,就是不能用的



我只能說Tesla還是太天真了

下次記得不要找印度人當主管


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.98.192 (臺灣)
※ 作者: exeex 2026-03-24 14:56:11
※ 文章代碼(AID): #1fmZMGoG (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1774335376.A.C90.html
jaricho: 還給我火星 不要退成月球1F 03/24 14:57
zaqimon: 節點失效 不能叫AI去debug嗎 反正現在AI很厲害2F 03/24 14:58
mynumber55: 靠腰原來是晶片太爛,我以為是成本幹不贏老黃3F 03/24 14:58
aloness: 不要找印度人當主管是真的…
甚至當下屬都不要,印度人真的是來幫台灣人減壽的(活活氣死4F 03/24 15:00
qaz27966: 專業說明推7F 03/24 15:02
cloud7515: 印度人接下來要征服日本了8F 03/24 15:02
hosen: 專業推9F 03/24 15:03
jceefailurer: 重壓台積,穩贏10F 03/24 15:04
hosen: 總是有人以為設計只要堆料就好11F 03/24 15:04
joygo: 印度人 很適合老馬其實 都是喊大然後無限延期12F 03/24 15:04
dieorrun: 但是印度人的創意我是不懷疑的 像之前的AI無人商店靠的是真人遠端當店員 這種創意我真的沒有13F 03/24 15:06
aloness: 老馬做的最起碼會看到他朝著目標做失敗的樣子,印度仔是不朝目標做也一樣失敗給你看15F 03/24 15:09
j32072: 看起來完全沒問題 期待雪茄漢堡產線17F 03/24 15:11
VicLien: 特斯拉搞特規還是可以啦 跟三星拿貨也是堪用 自駕車先鋪好衝衛星 等資本進來鬼轉老黃也不是不可能
反正誰要上太空目前很難繞過馬18F 03/24 15:13
s800525: 搞這個為了衝SPACEX IPO價格吧21F 03/24 15:14
cowaksor: 翻小車已經不稀奇了 要翻世界級的大車22F 03/24 15:15
Flyroach: 無人XX靠的是後方遠端搖控不是很多都這樣玩嗎23F 03/24 15:17
s800525: 在嘴無人工廠前,特斯拉先把上海廠搬回去美國吧
連特斯拉一半產能靠中國,還在那畫大餅24F 03/24 15:21
Usmall857: 等合併SPACEX就會轉彎了 呵呵26F 03/24 15:27
SkyPlus: 他的自傳就有很多畫大餅失敗的例子,不過也有工程師這三小KPI,事後卻成功的案例
只能給時間證明這次是SpaceX還是boring company了^(工程師"覺得")27F 03/24 15:28
PTTMAXQQ: 本來以為能移民火星
想不到變成在月球蓋工廠QQ31F 03/24 15:31
Xargon0730: 不要太粗暴33F 03/24 15:37
DDhow: 跟印度阿三合作過就知道他們有多爛34F 03/24 15:47
TISH12311: 嗯嗯 世界首富翻100次車都不會有事吧35F 03/24 15:50
cleanx: 只是要炒股票36F 03/24 15:50
JKjohnwick: 總有人覺得代工很簡單37F 03/24 15:52
hectorbibby: 好,特斯拉 空爆它38F 03/24 15:53
donod: 人家有AI+機器人 這些問題給AI+機器人 輕鬆突破^^39F 03/24 16:01
DellSale999: 相信老馬 不相信的褲子都被沖掉好幾條惹 產線吃薑母40F 03/24 16:05
darkangel119: 相信老馬 火星算什麼 十年後去仙女座星雲觀光42F 03/24 16:28
dkfs789: 不管你信不信反正特粉都會信43F 03/24 16:29
linleex: 火箭跟ai比晶圓難那麼多都能成功了44F 03/24 17:29
create8: 難怪dojo被砍45F 03/24 17:41
haopig: 馬粉真的很狂,居然覺得火箭比晶圓難很多46F 03/24 18:03
fallinlove15: 最後可能只有能吃漢堡有達成 改開速食店之類的 那用機器人沒問題47F 03/24 18:07

--
作者 exeex 的最新發文:
  • +26 Re: [新聞] 與台積電不一樣!馬斯克公布地表最大晶 - Stock 板
    作者: 1.34.98.192 (台灣) 2026-03-24 14:56:11
    先別管晶片廠怎麼蓋 先來看一下老馬之前晶片設計怎麼翻車的 先貼個tesla dojo 2砍掉的新聞 技術細節參考 他的架構是這樣 用354 riscv core組成一個die 再用25個die組成一 …
    48F 26推
  • +7 [心得] 8月 lv13 稀有度5以下 轉生天蠍 - PuzzleDragon 板
    作者: 36.234.198.104 (台灣) 2024-08-20 01:11:15
    10F 7推
  • +33 Re: [討論] 台灣谷哥有可能裁員嗎? - Tech_Job 板
    作者: 60.250.213.238 (台灣) 2022-11-18 13:31:05
    之前面過台灣Google Google在台灣招人仍然用美國的那套在招,我覺得挺蠢的 首先台灣跟美國環境差很多,台灣沒有刷leetcode的風氣。而高手集中在電機系,不像美國是在CS。 加上這麼冗長的面 …
    109F 38推 5噓
  • +36 Re: [閒聊] 新竹風評被害 - C_Chat 板
    作者: 60.250.213.238 (台灣) 2022-10-26 17:05:14
    其實說穿了就是貧窮限制味蕾 當學生的時候東西的確又貴又難吃 大學的時候跟其他縣市來的同學談吃的 就好像自己是木舌頭一樣 不停被酸美食沙漠 無力回嘴 只好跟著自嘲 但當你多蹲幾年 在竹科蹲久從新竹人變成 …
    109F 38推 2噓
  • +26 [心得] 3080 深度學習 GDDR6X過熱 - PC_Shopping 板
    作者: 1.169.178.29 (台灣) 2022-07-13 18:59:43
    先講結論: GDDR6X很燙,燙了就很不穩定 打遊戲沒事,但跑Deep learning訓練會壞掉 Deep learning這種應用建議直上帝版,甚至水冷版 以下是debug經驗分享: 之前從EVG …
    61F 27推 1噓
點此顯示更多發文記錄
(exeex.): Re: [新聞] 與台積電不一樣!馬斯克公布地表最大晶 - Stock板