看板 Stock作者 pmes9866 (I Need Some Sleep)標題 [新聞] 字節跳動「豆包 2.0」上線!性能對標GPT-時間 Sun Feb 15 23:50:13 2026
原文標題:字節跳動「豆包 2.0」上線!性能對標GPT-5.2、Gemini 3 Pro 但成本更低
原文連結:
https://m.cnyes.com/news/id/6345148
發布時間:2026-02-15 19:00
記者署名:鉅亨網新聞中心
原文內容:
在全球生成式人工智慧(AI)競爭加速之際,字節跳動正式宣布旗下「豆包」大模型邁
入 2.0 階段,推出面向代理時代的系統性升級版本。
官方強調,新版本在整體性能上可對標 GPT-5.2 與 Gemini 3 Pro,同時將推理成本降低
約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。
字節跳動於周六(14 日)公布,豆包 2.0 系列涵蓋 Pro、Lite、Mini 三款通用代理模
型,以及專門面向程式開發場景的 Code 模型。
其中,旗艦版本豆包 2.0 Pro 全面對標 GPT-5.2 與 Gemini 3 Pro,在多數視覺理解基
準測試中達到業界最高水準,並在國際數學奧林匹克、中國數學奧林匹克與 國際大學生
程式設計競賽中取得金牌。
目前,豆包 2.0 Pro 已全面上線,並接入豆包 App、電腦端與網頁版的「專家」模式;
Code 版本則整合至 AI 程式設計產品 TRAE。同時,火山引擎也已同步推出面向企業與開
發者的 API 服務。
業界分析指出,在真實世界的複雜任務中,大規模推理與長鏈路生成往往消耗大量 token
,若能在維持高效能的同時顯著降低成本,將成為模型商業化落地的關鍵。
多模態能力躍升至頂尖水準
豆包 2.0 在多模態能力上進行大幅強化,無論是影像理解、感知判斷、空間推演,或長
文本脈絡掌握,都展現明顯進步,整體表現躍升至業界前段班水準。
在動態情境辨識方面,該模型於 TVBench 等重要評測中名列前茅,並在 EgoTempo 測試
中取得超越人類平均成績的表現,顯示其在解析畫面變化、人物動作與節奏轉換時,具備
更高穩定度與準確度。
面對長時間影片內容,豆包 2.0 同樣展現強勁實力,在多項測試中領先其他主流模型,
尤其在串流式即時問答相關基準評比中表現突出。
憑藉上述能力,豆包 2.0 得以升級為更具主動性的 AI 助理,不僅能即時分析影像內容
、辨識環境變化,還能在互動過程中進行主動提醒與修正,甚至提供陪伴式回饋,讓使用
情境從單純回應問題,進化為主動引導與建議,適用於健身指導、穿搭建議等日常陪伴場
景。
推理實力對標國際強者 成本優勢成關鍵
在推理能力方面,豆包 2.0 Pro 透過強化長尾領域知識,在 SuperGPQA 測試中分數超
越 GPT-5.2,並於 HealthBench 奪得第一名。在科學領域整體表現上,則與 Gemini 3
Pro 及 GPT-5.2 相當。
於代理能力與高難度推理評測中,該模型在國際數學奧林匹克、中國數學奧林匹克與國際
大學生程式設計競賽中取得金牌成績,並在 Putnam Bench 上超越 Gemini 3 Pro 表現。
在人類的最後考試(Humanity’s Last Exam)測試中,豆包 2.0 Pro 則取得最高棻
54.2 分,於工具調用與指令遵循能力測試中亦表現優異。
更受市場關注的是,字節跳動表示,在維持與頂尖大模型相當效果的同時,豆包 2.0 的
token 定價降低約一個數量級,預計將在大規模推理與長鏈路生成場景中,大幅提升企業
導入意願與商業化可行性。
與此同時,基於 OpenClaw 框架與豆包 2.0 Pro,字節跳動已在企業協作平台飛書上打造
智慧客服代理。
該代理能透過調用不同技能完成客戶對話,遇到複雜問題時主動邀請真人同事加入群組協
作,協助預約上門維修,並於事後主動回訪與推薦產品。
Code 模型助攻開發效率
針對程式開發需求,豆包 2.0 Code 建構於 2.0 基礎模型之上,並針對程式設計場景進
行專項優化,強化對大型程式碼庫的解析能力與應用生成效率,同時提升模型在代理工作
流程中的自我修正與除錯表現。
目前該模型已作為內建核心模型,上線至 TRAE 中國版,並支援圖像理解與推理功能。
在實際案例中,開發者透過 TRAE 搭配豆包 2.0 Code,只需一次提示詞輸入,便能快速
搭建「TRAE 春節小鎮 · 馬年廟會」互動專案的基本架構與場景設計;經過約五輪提示
後,更是可完成整體專案開發。
該專案包括了 11 位由大型語言模型驅動的 NPC,能依據角色設定自然對話、主動招呼顧
客並進行現場議價;AI 遊客也會自行決定造訪攤位、選購商品與互動內容,呈現高度擬
真的虛擬市集體驗。相關提示詞與素材已於 GitHub 開源,供開發者測試與延伸應用。
目前,豆包 2.0 Pro 已於豆包 App、電腦端與網頁版推出「專家」模式,開放一般用戶
使用;面向企業與開發者,火山引擎亦同步提供豆包 2.0 系列模型的 API 服務。
字節跳動表示,未來將持續以真實應用場景為核心,推動模型能力更新升級,進一步拓展
智慧應用的邊界。
心得/評論:
字節跳動實際上是中國第一的AI廠商 在B端 C端市佔第一
先前SEEDANCE 2.0發布後引發熱烈討論 現在又發佈了豆包2.0
號稱性能對標GPT,GEMINI 3 PRO 但成本只要1/10
--
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.224.26 (臺灣)
※ 作者: pmes9866 2026-02-15 23:50:13
※ 文章代碼(AID): #1faUivxe (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1771170617.A.EE8.html
推 shuoyuan: 不錯,可以聽得懂閩南語,還能用閩南語當輸入法1F 02/15 23:54
→ jaytsu: 問問看敏感關鍵字會不會被拒絕訪問再說2F 02/15 23:57
推 ilGroundhog: 用審查過的資料生成ai根本沒威脅
seedance還有點威脅4F 02/15 23:59
推 bhmagic: 小紅I
不管政治審查之後好不好用 都可以給G家O家壓力 好事7F 02/16 00:13
推 iammatrix: 豆包真的超猛,直接開鏡頭跟他聊天 各種互動 幫你看各種物品即時辨別、計算10F 02/16 00:15
推 yuan0119: 各國都在搞AI,我們正在搞什麼13F 02/16 00:24
→ ssarc: 我們在專心做該做的事14F 02/16 00:25
推 eknbz: 我們專心做鏟子 礦商們去廝殺21F 02/16 00:46
噓 s930406: 全世界目前也就兩個國家有能力搞AI22F 02/16 00:50
推 mp5k6: 能色色嗎?不能我可是不要的喔23F 02/16 00:52
→ RunRun5566: 台灣在AI產業角色超重要吧怎麼有人問我們在幹什麼26F 02/16 01:11
→ Orianna: 拿鏟子就自滿嗎 新加坡都知道要和qwen合作做ai 有做出自己的模型
雖然新加坡政府投資背後技術還是阿里就是27F 02/16 01:15
推 holysong: 不知道台灣搞什麼gdp8.6,我覺得還是不要搞清楚,搞清楚反而降低
怎麼前幾篇講ai泡沫,然後你這篇說台灣不能只做鏟子30F 02/16 01:31
推 jacket664: 字節資金不輸七巨頭,就是買不到晶片33F 02/16 01:34
→ clmmu: 越多家搞越好,消費者越吃香37F 02/16 01:43
→ xxxzxcvb: 台灣在幫鏟子代工啊 雖然有40%產能要被搶了40F 02/16 02:25
推 nfsong: kimi claw $15/ 月 $31 / 月 $79 / 月 $159 / 月現在Token開始有價了41F 02/16 02:47
推 hank81177: 大陸AI比GPT、Gemini 、Grok都好用46F 02/16 04:08
推 saintsmw: 大致上又是拿ChatGPT來幫你服務。47F 02/16 04:20
→ farnk14: 中國講對標的通常就是48F 02/16 04:23
噓 cityhunter04: 燒大錢的ai還不一定成功,台灣賣鏟子等著用就好…笨蛋去砸錢幹嘛?50F 02/16 04:35
推 GoodID: 台灣的AI大模型做得非常非常爛52F 02/16 04:48
推 hankwtc: 笑死,還有人說好用,閹割的AI說好用。要不要去問64、維尼看看?54F 02/16 05:30
推 othen: 審查過的AI當寶我也是笑笑56F 02/16 05:33
推 sawe53: 習大大真忙59F 02/16 07:11
推 llgod: 看到推特說3.0要發佈了,可以生成完整電影時長……60F 02/16 07:22
噓 nsaids: 會自我審查的東西 當不了思維工具61F 02/16 07:22
推 TCPai: 限定14億人使用64F 02/16 07:28
→ DarkMore27: 美國巨頭把軍備競賽標準拉高,中國廠只能拼命說自己成本低功能一樣,笑笑就好65F 02/16 07:29
→ ffaatt: 會審查的一堆 只是你比較了解64 其他你不知道67F 02/16 07:32
推 dryadk915: 問川普不好寫了長篇大論 習近平就不回答 64也不回答 追問就被鎖帳號69F 02/16 07:39
推 RodrigueZ810: DeepSeek現在安在?
去年吹到頂破天花板 台積電會倒 不需要晶片了71F 02/16 07:42
推 lanevo9: 這東西去年演過一次大家都免疫 是說會選擇性回答的AI才更要謹慎使用 是不是刻意曲解事實很難說73F 02/16 07:44
推 a19851106: 豆包語音是真的強 其他功能不知道
重點是不用錢沒限制使用量75F 02/16 07:49
噓 chunfo: 中國ai一定會審查政治內容 但到底誰會和ai聊政治啊78F 02/16 07:58
→ yunf: 說穿了就是一個廉價品
就是大補帖的概念 到時候美國再啟動301之類的
別人開發出來的東西洗一洗拿來用 當然可以大幅降低開發成本81F 02/16 08:00
推 stoneoil: 美中兩國ai燒錢競爭,台灣半導體產業賺翻,這幾年經濟成長率要屌打中國惹85F 02/16 08:05
→ hzs6111: 消費者選現成的即可87F 02/16 08:17
推 art1: 為啥不會跟 ai 聊政治?有疑惑就問不是很正常?XDDD88F 02/16 08:17
推 Goldx5: Drtech有人攻擊中國AI,太過分了,快來護航91F 02/16 08:38
推 c928: 蒸餾完畢92F 02/16 08:39
推 labbat: 偵測到AI發射93F 02/16 08:50
推 dayuer: 台灣有什麼ai搬得上檯面?95F 02/16 08:53
推 s213092921: 美國AI的護城河又沒了,繼續燒錢堆算卡,這就是現代98F 02/16 09:02
→ selvester: 他的輸點就是伺服器位置,座落於1984天朝99F 02/16 09:02
→ selvester: 有天你會莫名其妙被拒絕請求,然後開始納悶到底是哪個詞語觸發了審查
要是他們團隊在其他地方研發也不至於debuff這麼多只需要問一句,哪天共匪特務想要調用使用者歷史
該公司有沒有權拒絕 是與否 決定消費者信任與發展101F 02/16 09:03
推 Lhmstu: Seedance真的猛,沒話說106F 02/16 09:07
噓 strlen: 中國AI永遠也走不出中國107F 02/16 09:08
推 s213092921: 美國ai還有錢繼續燒嗎?根本拉不開明顯的差距108F 02/16 09:08
→ strlen: 你敢輸入信用卡訂閱中國的AI嗎?
你不怕信用卡號哪天漏出去嗎?
誰他媽敢用啊?中國資安跟笑話差不多109F 02/16 09:08
→ s213092921: 笑死,strlen去看看微軟CEO的發言吧,還走不出中國咧112F 02/16 09:09
→ strlen: 你企業資料你敢給中國嗎?還不是乖乖跟歐噴愛或狗家買
微軟都要徹出中國了 笑死
你去路上問問 企業級的客戶 哪一家敢用中國AI服務會接中國AI也是模型放在其它地方的算力中心喇114F 02/16 09:09
→ cphe: AI又不一定要賣企業,Google最大收入還不是消費者市場,你以為每家公司都跟MSFT一樣嗎119F 02/16 09:11
→ strlen: 美國AI的護城河就是中國垃圾資安政策
seedance那種無視版權的東西 更沒有企業會用
誰知道用了你會不會把我企業IP機密全都搬走
消費者才不會付費買AI勒 有沒看過統計啊 只有8%不到會付費 免費仔九成 中國一定更高 99%吧
因為中國2025年平均年薪才11萬台幣 買個屁AI122F 02/16 09:11
推 cphe: 真愛硬凹 XD 串API的都不算消費者就是了128F 02/16 09:13
→ strlen: 世界屎坑 年均薪11萬 吹得跟什麼一樣 可憐哪 可憐哪129F 02/16 09:13
→ strlen: 串API也不會串你中國的服務商啊 又不是低能131F 02/16 09:15
→ mcc2029144: 台灣沒能力搞 不懂鄉民在優越什麼?
不然叫台灣廠商搞一個出來?一堆低能134F 02/16 09:16
→ strlen: 哪來的一堆你數據拿出來啊 笑死人 空想幻想
倒是一堆IP廠跟好萊屋都要出手提告惹 嘻嘻嘻
有教程就是有訂閱喔?那GPT跟Gemini教程是千百倍吧教程當訂閱量 快笑死138F 02/16 09:17
推 selvester: 這裡是股版:給個股點 美國是將AI推向藍海 做模型處理更多不同型態資料 從語言/程設/資料結構/畫面再到科學研究 數學/物理/化學/生物科學/醫學142F 02/16 09:19
→ selvester: 而中國舉國體制方向是紅海化 我更低成本能辦到
你已經辦到的事,至於你還沒辦到 我們也懶的去嘗試146F 02/16 09:19
→ ornv: 豆包轉發提示詞叫Gemini產出後再轉給用戶成本就低148F 02/16 09:19
→ thetide0512: 當初SUNO音樂也是一堆說提告 最終都和解可用
豆包的好處是中文邏輯 畢竟中文資料庫全球最大149F 02/16 09:19
推 s213092921: seedance不就幹掉美國sora了?151F 02/16 09:20
→ thetide0512: 如上面所說 豆包中文轉提示詞給其他AI使用是很方便152F 02/16 09:20
→ strlen: 每次過年都出來亂 煩不煩啊 去年也亂 結果勒153F 02/16 09:21
→ strlen: 哪次不是胡吹亂吹 過陣子就死了 dickshit誰還在用我不是針對中國啊 我說的事實 中國要解決資安跟版權不然永遠就是走不出中國 不然勒155F 02/16 09:22
→ seemoon2000: 這個產品如果GPT和Gemini 會被告到破產而已
AI的發展效率完全不覺得GPT和Gemini這時間辦不到158F 02/16 09:23
推 s213092921: 當好萊塢要提告時,代表seedance真的搶了他們的飯碗160F 02/16 09:24
→ strlen: 當初sora可以生一堆日本動漫 就被日商聯合警告了161F 02/16 09:24
→ strlen: 又不是做不到 笑死 人家做正經生意的只能縮了163F 02/16 09:25
→ s213092921: 即使GPT跟Google辦得到,也不可能提供字節跳動的低廉價格164F 02/16 09:25
→ strlen: 中國廠商版權和資安意識跟沒有一樣 誰要做你生意166F 02/16 09:25
推 cphe: 推文有人超激動 而且大概準備進桶XD167F 02/16 09:25
→ seemoon2000: AI發展大家看兩三年了 大家差距大多在三個月內而已168F 02/16 09:26
推 thetide0512: 其實SORA所有版本跟SD所有版本我都摸過 SD強很多
但我也相對期待SORA能端出更厲害的東西 有競爭才好169F 02/16 09:26
→ seemoon2000: 中國AI廠商對中國以外的消費者來說就是避風歐美的AI過度漲價的產品173F 02/16 09:28
→ cphe: 各家都有可能藏招啦 不敢放太快,要不然手上都沒牌可以打了,當初Deepseek 就是這樣加速各家發布時程175F 02/16 09:28
→ joeboy: 笑死,總有人拿8964出來說嘴,你中華民國怎不搞一個出來,然後問尹清楓案
一堆人活在過去,跟每年拿228出來鞭的一樣,可悲小丑183F 02/16 09:46
→ pmes9866: 確實 看openrouter 就知道成本很重要189F 02/16 10:05
→ skizard: 台灣資源也有限,不用每個領域都想贏 在那反觀的很搞笑191F 02/16 10:18
推 ilove305: 什麼都沒有的台灣,就繼續嘲笑中國194F 02/16 10:28
→ loom0et0bust: 便宜治百病,真的發展到AI普及成熟的階段,一般消費者也用不到多尖端的功能195F 02/16 10:30
推 sinon17: 跟在別人後面抄答案的,是能抄到第一嗎?197F 02/16 10:36
→ mmnnoo …
推 mmnnoo: 197樓有哦,掃地機器人,無人機,…199F 02/16 11:03
推 icosahedron: 看到8964就崩潰的人,蠻大的可能也是不知道台灣有哪些研發貢獻,整天只會酸還自以為很聰明的人201F 02/16 11:16
→ guteres: seedance 2.0 不是被告了?204F 02/16 11:21
推 jerrey: 可是火山要大陸門號 台灣享受不到205F 02/16 11:21
推 cetus: 對消費者來說多點競爭是好事206F 02/16 11:22
推 Westzone: 土共AI也只有舔共仔愛,是多喜歡跟韭菜一樣關在牆內207F 02/16 11:25
推 s213092921: 俺尋思GPT5.2也是才兩個月前的產品,原來輸給中國AI就是過氣210F 02/16 12:01
推 yamitis: 做出來的影片是真的扯213F 02/16 12:19
推 jiansu: 說中國ai 不行的自己去看open router 前幾名都是中國ai 便宜夠用 才是生產力 當然很多地方還是追不上美國 消費端字節很強 我Gemini訂閱 然後也用豆包 反正一般用途免費豆包很夠了 沒中國情結顧慮建議去試 一堆功能還免費 然後seedance這個就沒有敵手 我猜媒體業應該會準備被顛覆了214F 02/16 12:21
推 s213092921: seedance的確走不出中國,因為還在內測,海外要用就得翻牆220F 02/16 12:21
→ unima: 民進黨連電車充電都拖拖拉拉,耗電的AI目前只能嘴砲!222F 02/16 12:36
噓 strlen: openrouter的Provider幾乎全是美國 供三洨啦
還是你連Provider是什麼都不知道?笑死了224F 02/16 12:37
推 ubei: 大部分鏟子要被搶去美國生產了啊.可能在台灣的手機和電腦的居多226F 02/16 12:49
推 thetide0512: 我是用陸抖登即夢跟豆包 兩個都有seedance2y229F 02/16 12:58
噓 f12sd2e2aa: 哪一家ai不會審查 你去生成色情自殺看看230F 02/16 13:19
推 nfsong: pornhub ai231F 02/16 13:30
→ twinmick: 聊天回話辨識日常物品真的不用全正確+便宜治百病啦.加上無視版權,這種就中國的強項啊.232F 02/16 13:31
推 nfsong: 2個月內會有新創 發揮seedance 的porn video
沒想到那麼快 就達到這種領域
2個月以後 表演很差的女優 面臨失業
現在的 AV會社 都是固定系列 固定機位
可以想像 AV 新時代來臨234F 02/16 13:33
推 nfsong: 光是動畫 漫畫轉 真人 就有幾百萬的樣本
token 不夠啊~~241F 02/16 13:45
推 ceca: 幹,你們討論那麼多不重要的,重要是,可以澀澀嗎245F 02/16 14:40
→ NEWinx: 鏟子不用自滿,但是台灣不大,不需要什麼都搞,搞好關鍵就行了246F 02/16 14:42
推 offstage: 科技要進步就要用在兩個地方:1.軍事 2.瑟瑟248F 02/16 14:46
推 CGDGAD: 美國玩完了,狗家跟gpt下去了249F 02/16 14:49
推 KKKAO: 蒸餾專家251F 02/16 15:46
推 stlinman: 我玩openclaw單日可以燒掉1億多token。量大管飽還是有市場需求的。 就像市場有人加高級汽油也有加柴油!253F 02/16 16:22
推 nfsong: 樓上是跑圖吧 寫程式需要那麼多嗎
你開幾個agent255F 02/16 16:45
推 pttym: 中國ai取代大部分人力後...絕對爆炸一堆人找不到工257F 02/16 16:49
推 nfsong: 還在大規模失業陰謀論阿 看看非農數據暴增
AI 產生了更多工作
只有固執 不用AI的人被淘汰
使用AI輔助的人 只會發現更多需求258F 02/16 16:51
→ gamania5972: 看來deepseek的路又要再一遍囉?美股要殺幾天?262F 02/16 17:04
推 iqqi4200: 串到 google 再串回來263F 02/16 17:32
→ jackz: 對標又降低是什麼描述方式
前面說不用全正確更好笑了 誰要一直給錯誤的AI266F 02/16 17:56
推 sd2567: 對標就是笑話269F 02/16 18:34
推 Sawilliam: 想想大陸被美國各種禁令下 AI表現還是跟美國巨頭不相上下..大陸的人才的質量真的很可怕..270F 02/16 18:42
推 stratuss: 台灣有TAIDE怎麼輸!272F 02/16 19:00
推 sid3: 抖音ai視頻超強282F 02/16 19:49
→ twinmick: 又不是專業解題數論工作用AI,不用追求100%正確率,聊天,影片,畫圖,生活問答是要多正確啦??283F 02/16 20:48
→ youdar: 人家標榜的是運算成本低 又不是多屌285F 02/16 20:52
→ twinmick: seedance2.0 還不是一堆瑕疵,但是有消費者很在意??286F 02/16 20:56
→ twinmick: 跑專業學術跟數學競賽的AI跟消費者關係更小了,它給出的答案普通老百姓有辦法靠自己判斷對錯? 所以專業用途的才是最需要高正確率的AI..288F 02/16 21:03
推 jiansu: 除夕qwen 3.5 plus上線 價格gpt5.2的1/15 阿里其實還有一個14nm對比h20的ai晶片 可以用來訓練 反正不用美吹或是中吹 東西出來就給推 如果開源那就大推291F 02/16 21:28
推 somanyee: 豆包的ai podcast 比google家更好295F 02/16 22:02
--