看板 MobileComm
作者 aa1477888 (Mika)
標題 [討論] 豆包AI手機原理深度分析
時間 Wed Dec 10 14:32:05 2025


最近在中國很紅的豆包手機

如果你還不知道是什麼

建議可以看一下六分超超的影片

https://youtu.be/f1wylnFgqFw

它確實可以算是全世界第一台

深度整合AI模型、AI代理的智慧型手機

只要用自然語言下指令

就能讓AI代理全自動操作手機

完全背景作業 無需使用者任何干預

但也因為「太強大」

所以動到了「其他人」的利益

開賣才一天 就被微信、支付寶接連封殺

然而豆包手機只不過是一台

根本不算正式型號的實驗品

卻已然成為「你不敢用的手機」

只不過 字節跳動(抖音母公司)的豆包AI

究竟是怎麼實踐AI手機的全自動化操作?

剛好今天B站UP老戴拆解了出來

https://b23.tv/diNmXCT

簡單來說

豆包AI並沒有調用上層的API

而是在一塊內建的虛擬螢幕中

實現AI代理的後台操作

豆包AI深入手機底層 直接跟系統整合 權限大開

甚至會從螢幕畫面算繪的系統緩衝區

直接抓取截圖

以每3-5秒的頻率上傳字節跳動的伺服器

由雲端AI模型讀取畫面、運算、給出指令

接著再回傳手機 指導手機上的AI進行操作

從這樣的操作路徑來看

隱私顯然是個非常大的疑慮

然而

豆包手機的發展方向 至少它所呈現出來的樣子

確實很有可能成為將來手機系統的樣貌

或許差別只在於

究竟是由誰來做這件事情而已

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.35.220.53 (臺灣)
※ 作者: aa1477888 2025-12-10 14:32:05
※ 文章代碼(AID): #1fEHFd3j (MobileComm)
※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1765348327.A.0ED.html
※ 同主題文章:
[討論] 豆包AI手機原理深度分析
12-10 14:32 aa1477888
abc0922001: 滿合理的執行方式1F 12/10 14:45
ivon852: 這手機真的變天網的終端了,人們只是節點2F 12/10 14:57
charmingpink: 連中國自己人都怕到下架3F 12/10 15:02
xzcb2008: 最近我看到有些奇怪應用 釘小朋友看書坐姿4F 12/10 15:05
LastAttack: 可能未來智慧型手機還是會苟活,低隱私操作給新AI終端,高隱私的留給智慧型手機5F 12/10 15:06
sova0809: 你怕聯網問題 現在直接開源那你自己離線製作
各大APP這塊守不住是遲早的問題
這塊領域是 微軟 蘋果 OPENAI 跟 字母 等各巨頭的終極目標7F 12/10 15:07
Erechtheus: 你敢相信一隻偷偷截圖的私人手機??11F 12/10 15:10
LastAttack: 講開源太早 首先大模型要先能跑在手機之類的終端
應該起碼還要兩三年吧
目前手機能跑的低參數模型可用性還很普通12F 12/10 15:10
sova0809: 昨天對面 智譜就開源了 直接讓你玩 這塊變動太快15F 12/10 15:14
ga278057: 以後有機器人在家 那不就隱私看光光?交給ai勢必是趨勢16F 12/10 15:14
sova0809: 這塊最大的問題永遠卡住的是使用者授權問題18F 12/10 15:14
LastAttack: 或者至少要能跑在PC上,這樣隱私問題就能透過遠端自己的PC解決19F 12/10 15:15
sova0809: 當初微軟那個AI技術被喊停也是這個問題21F 12/10 15:15
pmes9866: 阿里的手機上的4B量化其實蠻強的22F 12/10 15:18
LastAttack: 哇智譜開源那個也是衝著手機自動化操作來的,看起來自建伺服器來跑豆包這種手機助手已經算是未來已來了23F 12/10 15:23
jacky40383: 系統權限與資料隱私搞不定,沒人敢用26F 12/10 15:34
theevilM: 很簡單啊,自己建一個本地LLM就不怕資料外流了27F 12/10 15:36
aa1477888: AutoGLM的Phone Agent應該是被豆包逼出來的28F 12/10 15:38
sova0809: 他跟豆包其實是同一戰線 各大App用隱私安全封鎖 那就開源讓你離線自己玩客製化 讓操作資料都自己機台
我個人也是傾向離線自設系統這塊 不然也不敢放權過29F 12/10 15:42
nekoares: Rabbit R1就是想做這種東西吧34F 12/10 15:58
xzcb2008: b站上有一個在討論底層的
就是你這篇啦
傳圖片 回指令真的蠻恐怖,35F 12/10 15:59
hyghmax1202: 隱私問題的解決方法會落在邊緣AI上,不可能跟你上傳到伺服器用雲端AI處理,別說隱私了,無法聯網就變一台普通手機了,總之算力和電力會進一步提升。38F 12/10 16:08
amd3dnow: 因為隱私問題android,iphone才不敢下放...
不是技術問題,是敢不敢...41F 12/10 16:15
rich22084: 所以沒網路的話這就是隻垃圾43F 12/10 16:16
Dragonz: 等蘋果做出來大家就不會介意什麼隱私了44F 12/10 16:17
h14315324032: 除非能落地LLM到mobile到「可用」時,才不會有問題,無論是哪間公司開發都一樣45F 12/10 16:18
doom3: 感覺三年後的手機就能做到離線代理47F 12/10 16:23
pontifical: 蘋果想像中的siri48F 12/10 16:32
s78513221: 這東西給大廠做爭議很大,所以只能由小廠推
光是歐美一票隱私權至高的整天抗議就飽了49F 12/10 16:32
amd3dnow: 歐美一堆人權鬥士等著你開放,再嘞索天價賠償金
中國沒這些顧慮51F 12/10 16:35
s78513221: 至於蘋果用錢砸哭質疑隱私權的人確實很有用53F 12/10 16:37
epidemic000: 我覺得蠻屌的54F 12/10 16:39
xzcb2008: 大家覺得這是不是真的未來啊55F 12/10 16:42
marx0126: 最終目標植入體內 嘻嘻56F 12/10 16:44
iamsosmart: 離線代理的話,那耗電量呢?耗電量也是個問題吧57F 12/10 16:46
pujos: 跟隱私一點屁關係都沒有58F 12/10 16:47
vinny93: 回樓上 不用看B站那些人說的 我覺得他們滿蠢的59F 12/10 16:51
x20165: 遊戲操作類似腳本?60F 12/10 16:59
is1128: 等 Google TPU 降到手機可乘載的電力跟耗能
天網就真的來臨了61F 12/10 17:01
empingao: 之前看榮耀YOYO就很強可系統級操控,豆包更猛。63F 12/10 17:14
greg7575: win11 也會截圖64F 12/10 17:29
xzcb2008: 真的假的win11也會=.=65F 12/10 17:46
agong: Win11 可以關Recall66F 12/10 17:49
a0935006936: 滿厲害的但感覺還是有很多問題要考慮67F 12/10 18:05
ophanim: 如果出現能自架的agent開源框架就沒有隱私問題了68F 12/10 18:06
cp296633: 適合老人用 連line都不太會的那種69F 12/10 18:13
ptta: 動了所有大廠的蛋糕,已經被封殺了
不信你試試看,保證喜提封號70F 12/10 18:19
emptie: Windows的recall是在本地算的啊
本來有上傳的功能但拔掉了
不過我還是覺得動別人的蛋糕這件事比隱私啥的嚴重多了
我想到的悲觀未來就是那些巨頭推出自己的ai終端,但只能操控自家的app72F 12/10 18:25
madeinheaven: 上傳字節跳動的伺服器 恐怖78F 12/10 18:27
emptie: 如果Google想自己來,可能所有合作夥伴都會跟他翻臉自立門戶79F 12/10 18:28
good5755: 這已經不是系統開後門了 這是大門沒關81F 12/10 18:30
emptie: 蘋果或是華為那種關起門來自己玩,能挾持用戶自重的廠商比較有可能做到,但我覺得還是會被這些巨頭強力抵制就是了……畢竟這是要把別人的根拔了的侵略性行為82F 12/10 18:30
allyourshit: 系統權限全開 銀行帳號被幾秒搬空也是很可能的事
這根本是詐騙集團夢寐以求的絕佳工具86F 12/10 18:43
amd3dnow: 就像你的電腦遠端分享給別人一樣....88F 12/10 19:00
shokotan: 真好用 可愛 很像有個朋友幫你操作 滿好玩的呀
如果有專用AI晶片 算法夠快 耗電少 那根本完美耶
再也不用接詐騙電話 不用看到詐騙廣告
老人不再需要學習複雜手機操作 說一下就可以了
現在你上的PTT不都是在裸奔嗎 IP完全暴露
全民的個資也早就外洩 所以這手機沒什麼好怕的吧
說不定AI才是最值得信任的朋友 像狗狗一樣
發現有異常立刻可以通知你 甚至預防老人被詐騙
什麼一頁式廣告 它肯定幾秒回答 老人不會再被騙89F 12/10 19:19
kanding255: 看起來很屌欸98F 12/10 19:35
stlinman: AI代理目前連瀏覽器都玩不太起來,我是更不看好私密性更高的手機能玩出什麼進展。99F 12/10 19:43
SpectreMan: 這才叫「智慧」手機,而不是一直在宣傳
手機的相機錄影多厲害101F 12/10 21:32
yunf: 吹的弄一台出來看誰買103F 12/10 22:14
Yoimiya: 人類真的要被淘汰了104F 12/10 22:20
nakts0123: 正常服務的工程師都會求封掉 誰想被用戶AI搞到加班105F 12/10 23:05
ageminis: 推測現在應該是自動化操作被封印著
等各國人覺得隱私被做手機的軟體商看光,覺得沒啥大不了就會慢慢開放這功能106F 12/10 23:40
chunshuo: 有鋼鐵人中賈維斯的感覺109F 12/11 00:07
AFM: 小寧是我最好的朋友,我每天都跟她聊到2點110F 12/11 08:15
akimu: 脫褲子放屁的感覺 到底誰會用這些功能....111F 12/11 08:24
KooA: 這東西是能幹嘛?一人網軍?112F 12/11 08:54
masato25: https://arborlogicai.com/zh-TW/products/arbor-ai/ 我自己開發的離線在Iphone 跑本小模型113F 12/11 11:20
ARBOR AI - ArborlogicAI
低成本設計本地VLM視覺模型AI ...

 
vivixzxz: 現在這麼強的嗎.....115F 12/11 13:45
foolwind: 再也不用接詐騙電話 因為AI幫你自動接洽詐騙集團了116F 12/11 14:44
sid3: 大部分ai都是資料上傳伺服器運算,你的手機硬體根本算不出來117F 12/11 16:07
akanokuruma: 看完覺得很厲害,完全不用多開網頁看資料翻來翻去就能找到想要的資料119F 12/11 16:29
keigowei: 很厲害但現階段誰敢用這玩意就是把自己全交出去121F 12/11 17:40
akanokuruma: 這個手機不應該安裝付款APP跟照相機XD122F 12/11 17:56

--
作者 aa1477888 的最新發文:
點此顯示更多發文記錄