看板 Stock
作者 jerrychuang ()
標題 [新聞] 李飛飛World Labs首款產品Marble登場!
時間 Thu Nov 13 22:06:05 2025



原文標題:

※請勿刪減原文標題
李飛飛World Labs首款產品Marble登場!給一句提示就可生成3D世界,空間運算有何商業
潛力?


原文連結:

※網址超過一行過長請用縮網址工具
https://www.bnext.com.tw/article/85088/marble-world-model
李飛飛World Labs首款產品Marble登場!給一句提示就可生成3D世界,空間運算有何商業潛力?|數位時代 BusinessNext AI教母李飛飛2024年創辦的AI新創World Labs,如今推出第一款商業化模型「Marble」,讓用戶可以用幾句話、一張圖生成一個3D世界。 ...

 

發布時間:

※請以原文網頁/報紙之發布時間為準
2025.11.13

記者署名:

※原文無記載者得留空
陳建鈞

原文內容:
由AI教母李飛飛共同創辦、著眼空間運算的新創World Labs,如今推出了首款商業化產品
Marble,用戶可輸入文字、圖片或影片,即可生成一個完整的立體空間。

根據《TechCrunch》報導,距離World Labs宣佈完成2.3億美元募資大約一年時間,這間
新創公司便發布了這款生成式世界模型產品。兩個月前,該模型以Beta預覽版的形式推出
,現在也正式推出服務。


一句話、一張圖生成小小世界,世界模型「Marble」正式上線
Marble的核心能力是讓使用者透過多模態輸入,將文字提示、照片、影片、3D佈局或全景
圖,轉換為可編輯和下載的3D環境。李飛飛向媒體表示,世界模型是生成式AI時代的重大
發展,「大型世界模型是釋放AI潛能的重要一步。」


與其他生成式模型最大的差異在於,Marble是直接建立一個完整的3D環境,並且可供下載
,而不是在用戶探索過程中即時生成的世界。World Labs 表示,這能減少畫面變形或不
一致的問題,並讓用戶後續加工利用。


Marble的共同創辦人賈斯汀.強森(Justin Johnson)表示,這是一個「生成 3D 世界的
一個全新類別的模型」。強森指出,Marble未來的一個方向是創意應用,聲稱該服務具備
完善的編輯工具讓用戶反覆調整場景,其成果預計可以運用在遊戲、視覺特效和VR產品之
中。


不過,目前遊戲產業對AI的看法仍然好壞參半,近期一次遊戲開發者大會上的調查顯示,
約有3分之1受訪者對AI如何影響遊戲產業抱持負面看法,較去年的調查高出12個百分點,
AI生成內容的低劣品質、侵權等問題是許多從業人員不滿的原因。


目前在Marble網站上,用戶可以瀏覽不同作者生成的大量3D世界,又或者透過輸入提示詞
、上傳圖像影片自行創造心目中的虛擬世界。

Marble現在提供四種分層付費方案:

免費方案:提供四次文字、圖像或全景圖生成。
標準方案:每月 20 美元,包含 12 次生成,並支援多圖/影片輸入和進階編輯 。
專業方案:每月 35 美元,包含 25 次生成,提供場景擴展和商業權利 。
極致方案:每月 95 美元,包含所有功能和 75 次生成

看好空間智慧成AI新領域,李飛飛為「世界模型」寫下定義
且在World Labs推出首款產品之前,李飛飛發表了一篇宣言,聲稱空間智慧會是AI技術發
展的下一個新領域。她首先點出了大型語言模型當前的限制,形容它們就像是身處黑暗中
的語言大師,「能言善道卻缺乏經驗,博學多聞但沒有根基。」


她指出,空間智慧徹底改變創造及體驗現實與虛擬世界的方式,顛覆敘事、創造、機器人
技術、科學發現等眾多領域。尤其是機器人技術,她認為缺乏對物理世界的感知及理解能
力,是機器人技術發展的最大限制,賦予機器人空間智慧將對眾多產業帶來深遠影響。


不過世界模型目前仍是個相對模糊的新興概念。例如,Meta首席AI科學家楊立昆(Yann
LeCun)認為它是AI發展的未來,但更側重於AI的自主學習與因果理解。而在她的宣言中
,李飛飛則以三種核心能力為基礎,為世界模型下了明確定義。


生成能力(Generative):模型能生成多樣且合理的世界。

世界模型能「自己生成」世界。
生成的世界要在感知、幾何、物理上合理,並且多樣化。
模型應該理解世界的過去狀態,並保持與現在的一致性。

不論是虛擬空間還是真實場景,都能生成可觀察、可使用的世界狀態。

多模態(Multimodal):模型能從多種資訊理解世界

世界模型能接收各種形式的資訊:圖片、影片、深度圖、文字、手勢或動作。
它能把這些部分訊息整合成完整的世界狀態,像人類或動物一樣理解世界。
也能用多種方式與人或代理互動,輸入和輸出不侷限單一形式。
互動能力(Interactive):模型能根據動作或目標預測世界變化。

世界模型能根據動作或目標預測世界的下一步狀態。
輸出會符合物理規律、語義、動態行為,保持前後一致。
強大的模型甚至可以在目標驅動下,不只預測世界狀態,還能預測下一步行動。
她在文章的最後寫道,空間智慧能提昇人們最為重視的生活品質。在空間智慧能力誕生在
生物身上至今5億年,人類終於有機會將這項能力賦予機器,並造福世界各地的人們,「
如果沒有空間智慧,我們對真正智慧機器的夢想是不完整的。」



心得/評論:

※必需填寫滿30正體中文字,無意義者板規處分
理組的世界模型要上了
不過不知道效果如何?

但應該還是需要更大的算力
更大的記憶體吧?

重點是演算法還是transformer?
還是還在尋找更佳的演算法?

還是理組模型只要理解
不需要死背
所以算力記憶體需求大幅減少?


不可能吧......
等大神開示...
99NV
99MU
99BRCM
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.146.68 (臺灣)
※ 作者: jerrychuang 2025-11-13 22:06:05
※ 文章代碼(AID): #1f5UNFsh (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1763042767.A.DAB.html
odddriver: 挖感覺很猛1F 11/13 22:07
DreamW: 看成李發發2F 11/13 22:17
JoeyChen: 上去看了那些作品 它的用途是創建風格化的場景嗎?3F 11/13 22:19
gk1329: 做遊戲更簡單惹4F 11/13 22:20
northsoft: 是說生這個要幹嘛?5F 11/13 22:22
Marble
Create and share 3D worlds with Marble ...

 
duriamon: 沒什麼用的東西,這東西就只是個3D建模AI,跟她宣稱的什麼大語言模型的未來沒什麼半毛錢關係,就整天吹而已,笑死!7F 11/13 22:25
yesonline: 先讓投資者看到東西啦. 這樣後續才能繼續注資...10F 11/13 22:26
joshddd: 技術細節 沒有透漏嗎?11F 11/13 22:40
tanby: 3D世界建起來後 接著就是包含物理特性  後續延伸的東西很多12F 11/13 22:41
ActionII: 文字資料到頭了,開始理解視覺資料很正常吧
可以理解3d 物理世界,比大語言模型更有用惹14F 11/13 22:48
truehero: 世界模型產生模擬資料訓練機器人阿16F 11/13 22:56
Obama19: AI教母來了17F 11/13 22:59
cphe: 看來AI泡沫就是笑話了18F 11/13 23:06
mokumoku: 這說真的滿猛的19F 11/13 23:09
epephanylo: 感覺對遊戲業是個好消息20F 11/13 23:09
guanting886: 目前看起來像是擴散模型3D版 後面的物理/物體結構 Ai什麼的應該沒有生成出來相關參數 看起來比較能輔助AR/VR開發的快速建模
但整到遊戲去開發者可能更痛苦
待教母補完後面那段21F 11/13 23:15
epephanylo: 點了幾個演示,他根本沒建模 XD
就是搞了個蛋貼個圖假3D這樣 只能當作概念溝通用吧26F 11/13 23:19
bj45566: 還是希望多一點人才投入研發世界模型28F 11/13 23:22
Lowpapa: Fake29F 11/13 23:30
madeinheaven: 沒啥用30F 11/13 23:53
NCCUexpert: 沒啥用,沒看出價值我太膚淺了嗎31F 11/14 00:11
odddriver: 一個能做遊戲,一個給機器人用
馬斯克做世界模型也是一樣概念,就是遊戲也能用32F 11/14 00:18
nfsong: 教母
https://www.youtube.com/watch?v=8OhrVkDRN2Y
一張圖 生成3D 地圖
未來 遊戲引擎越來越容易
先生成2D 美術圖  然後轉3D圖
以前很多 美術渲染很困難
現在 就是先生成 1萬種藝術風格
然後1萬種風格 帶入遊戲引擎 產1萬種地圖
demo 快很多
其實 現在AI產很多 細緻的圖 已經是美術設計辦不到34F 11/14 00:25
atari77: 用文字與圖片就可生成3D世界模型哪不厲害 超強好嗎44F 11/14 00:33
nfsong: 細節很多的 要再產3D 更難45F 11/14 00:34
atari77: 燈光貼圖都弄好 對動畫與遊戲省多大的工夫人力成本再稍微做一些微調就能符合需求 超好用46F 11/14 00:34
nfsong: 譬如Steampunk 建上萬個齒輪
建模還不建到死
主要是想 橋接物理世界
應用在機器人身上  就是視覺空間化
很久以前採訪她  就有說 主要是為機器人橋接物理
世界48F 11/14 00:35
DrTech: 怎麼那麼多人大開眼界,文字轉3D技術,隨便一個大學生都能做的技術,都開源一堆了也那麼驚訝
隨便舉例:https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1 這都出來多久了。
文字或圖片產出3D場景根本沒什麼技術。精確度能不能達到工業級才是重點。給機器人學又更好笑了,物理精度或視覺真實那麼差的環境,機器人學了也不能用。54F 11/14 01:16
GitHub - Tencent-Hunyuan/Hunyuan3D-2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material From Images to High-Fidelity 3D Assets with Production-Ready PBR Material - Tencent-Hunyuan/Hunyuan3D-2.1 ...

 
nfsong: 不一樣的東西吧
混元3D 是一般的3D 建模  沒有建空間
HunyuanWorld-1.0
就是李飛飛在做的東西
https://techcrunch.com/2025/11/12/fei-fei-lis-world-labs-speeds-up-the-world-model-race-
with-marble-its-first-commercial-product/
比較的好像是  Google’s Genie
能夠很好的生成一個空間  就能生成更多
譬如迷宮生成
主要還是描述真實物理世界61F 11/14 01:30
tanby: 混元模型跟這個技術效果差很多 要不要先去用用看再來講啊72F 11/14 01:46
nfsong: 應該是 混元世界模型
B站 有人在實測marble 了  好像蠻爛的 haha
剛開始
就是 拿混元世界 比marble ...兩個一樣爛
剛開始疊代吧
和leaderboard LLM 好像也有 3D場景的指標數值
慢慢會變強吧74F 11/14 01:47
tanby: 要拿混元世界-mirror 模型來比才是,生成的東西差不多81F 11/14 01:54
nfsong: 和前兩天 FAIR 田渊栋說的
這東西要變成framework給人用  應該會走開源路線
現在是 domain 模型 產業模型大爆炸時代
人人都在做模型
撇除 細節  這東西  拿來DEMO給甲方  蠻適合的
是不是 甲方要的  一個眼緣  送甲方1000個世界渲染包含  室內設計喔83F 11/14 01:55
ggirls: 教母漂亮嗎90F 11/14 03:56
qwe78971: 懶得看 Ai要做3D遊戲還太勉強了 光生出幾千面的模型 問題就大到不行 不是人人拿頂尖顯卡在玩耶91F 11/14 04:49
chienk: 哇。產品落地。 濾鏡拿掉了。93F 11/14 07:42
※ 編輯: jerrychuang (118.160.146.68 臺灣), 11/14/2025 07:50:51
a9564208: 這對傳媒娛樂產業很有幫助94F 11/14 07:59
csyang: 真的很討厭名字有疊字耶~95F 11/14 08:30
smallkop: 阿靠北這不就元宇宙96F 11/14 08:30
pov: ANN都要大量訓練資料 跟生物神經運作方式本質不同97F 11/14 11:05
loking: 以後搭配vr   可以一直發現新世界 不會地圖玩膩98F 11/14 11:46
decorum: 有什麼運用可能要後續開發者去拓展 原創團隊未必能預先設想到其潛力99F 11/14 12:45
quartics: 世界模型也達不到AGI101F 11/14 14:30
bnd0327: 空間智能方向是必要的,但輸入輸出還有待定義
要像ChatGPT那樣給公眾玩就是變這種玩具樣102F 11/14 15:41

--
作者 jerrychuang 的最新發文:
點此顯示更多發文記錄