※ 本文轉寄自 ptt.cc 更新時間: 2025-11-21 14:52:30
看板 Stock
作者 標題 [新聞] Gemini 3 Pro Image:「Nano Banana Pro
時間 Fri Nov 21 01:05:41 2025
原文標題:
Gemini 3 Pro Image:「Nano Banana Pro」重新定義 AI 影像生成
原文連結:https://o3o.us/dKrxQ7
發布時間:November 21, 2025
記者署名:TechApple.com 編輯部
原文內容:
在生成式 AI 競爭白熱化的當下,Google DeepMind 再次拋出重磅更新。全新影像生成引
擎——Gemini 3 Pro Image,其核心驅動更是被命名為極具話題性的 「Nano Banana Pro
」。這不僅是畫質的提升,更是對「精準控制」與「工作室級品質」的一次全面宣戰。在
Google AI Studio和AI Studio已經上線,注意有部份地區未必能用。
擎——Gemini 3 Pro Image,其核心驅動更是被命名為極具話題性的 「Nano Banana Pro
」。這不僅是畫質的提升,更是對「精準控制」與「工作室級品質」的一次全面宣戰。在
Google AI Studio和AI Studio已經上線,注意有部份地區未必能用。
工作室級的精準控制:從「抽卡」到「設計」
過去的 AI 繪圖往往被戲稱為「抽卡」,但在 Nano Banana Pro 的加持下,Gemini 3
Pro Image 將重點完全轉向了 「Studio-quality control(工作室級控制)」。
這款模型的核心承諾在於「對影像的每一個細節進行精細控制」。這意味著創作者不再需
要反覆嘗試隨機的 Prompt,而是能夠真正像使用專業軟體一樣,對畫面進行精確的調度
。
要反覆嘗試隨機的 Prompt,而是能夠真正像使用專業軟體一樣,對畫面進行精確的調度
。
角色與場景的完美融合
對於敘事類創作者而言,最大的痛點莫過於角色的一致性。Gemini 3 Pro Image 在這方
面展現了強大的能力。官方資料明確指出,使用者可以 「將你的角色放入全新的場景中
,並更換新的服裝」。這一功能直接打破了過去 AI 生成中「換個場景就換張臉」的魔咒
。
面展現了強大的能力。官方資料明確指出,使用者可以 「將你的角色放入全新的場景中
,並更換新的服裝」。這一功能直接打破了過去 AI 生成中「換個場景就換張臉」的魔咒
。
更進一步,它支援 「混合多張參考圖像」,並能構建出保留了選定細節的複雜構圖。這
不僅僅是簡單的拼貼,而是能夠協助創作者 「在一系列影像中勾勒出完整的故事」。從
單圖生成進化到連貫敘事,這是 AI 進入專業工作流的關鍵一步。
不僅僅是簡單的拼貼,而是能夠協助創作者 「在一系列影像中勾勒出完整的故事」。從
單圖生成進化到連貫敘事,這是 AI 進入專業工作流的關鍵一步。
突破文字與知識的邊界:海報與圖表的終極解決方案
長期以來,AI 在生成圖片中的文字時總是「力不從心」,出現亂碼或拼寫錯誤是家常便
飯。Gemini 3 Pro Image 對此進行了針對性的優化。
清晰的文字生成能力
DeepMind 強調,新模型能夠 「為海報和複雜圖表生成清晰的文字」。這對於平面設計師
和行銷人員來說是一個巨大的福音。你不僅可以直接生成帶有正確標語的海報,甚至可
以 「將你的設計翻譯成不同的在地化語言」。這意味著,一個設計稿可以快速裂變為適
應全球不同市場的版本,極大地提升了跨國行銷的效率。
基於現實世界的知識庫
除了文字,模型的「腦子」也更好用了。利用 Gemini 龐大的現實世界知識,該模型能夠
交付 「精確的結果」,這在生成 「複雜的資訊圖表」 或 「歷史精確的場景」 時尤為
重要。它不再是憑空捏造,而是基於數據和事實進行視覺化呈現,這讓它在教育和專業簡
報領域的應用潛力大增。
交付 「精確的結果」,這在生成 「複雜的資訊圖表」 或 「歷史精確的場景」 時尤為
重要。它不再是憑空捏造,而是基於數據和事實進行視覺化呈現,這讓它在教育和專業簡
報領域的應用潛力大增。
強大的後期編輯流:修復、光影與混合
Gemini 3 Pro Image 不僅是一個生成器,更是一個強大的編輯器。它引入了進階的創意
工作流支援,讓使用者可以 「測試想法、創建引人注目的設計並製作原型」。
多模態的理解與編輯
透過 「上傳圖像並分享文字指令」,使用者可以用最自然的語言與 AI 溝通。想要微調
?沒問題。你可以利用其 「多模態理解(Multimodal understanding)」 能力,對畫面
進行複雜且詳細的修改。
?沒問題。你可以利用其 「多模態理解(Multimodal understanding)」 能力,對畫面
進行複雜且詳細的修改。
高階編輯功能
官方特別提到了幾個令人印象深刻的高階功能:
遮罩編輯(Masked editing): 對特定區域進行精準修改。
大幅度光影變換: 例如直接將畫面從 「白天變為黑夜」,這需要模型對光線物理有極深
的理解。
影像混合: 將不同素材無縫拼接,創造出全新的視覺體驗。
這些功能讓 Gemini 3 Pro Image 能夠承擔起「修圖師」的角色,而不僅僅是「畫師」。
誠實的技術報告:不迴避缺陷的透明度
誠實的技術報告:不迴避缺陷的透明度
與許多過度包裝的 AI 產品不同,DeepMind 在發布頁面上展現了難得的技術誠實,詳細
列出了模型目前的局限性。這種「自我揭短」反而增加了專業用戶的信任度。
目前的技術瓶頸
儘管冠以 “Pro” 之名,官方坦承 「並非 Gemini 生成的每張圖像都是完美的」。以下
是目前仍可能遇到的挑戰:
細節處理: 模型在處理 「小臉(small faces)」、「準確拼寫」 以及影像中的 「精
細細節」 時仍可能感到吃力。
複雜數據的誤讀: 雖然擁有豐富的知識,但在生成 「資訊圖表、標註圖表或呈現複雜數
據」 時,它可能會 「誤解資訊或產生與事實不符的結果」。官方強烈建議使用者 「務
必驗證數據驅動的輸出結果」。
據」 時,它可能會 「誤解資訊或產生與事實不符的結果」。官方強烈建議使用者 「務
必驗證數據驅動的輸出結果」。
語言與文化的隔閡: 雖然支援多語言翻譯,但在 「語法、拼寫、文化細微差別或成語
」 方面仍可能遇到困難。
物理邏輯的瑕疵: 在進行如「日夜變換」或「影像混合」等高階操作時,有時會產生 「
不自然的結果、視覺偽影或不連貫的場景」。
心得/評論:
Google高層前幾天就有預告
前天的Gemini 3發布只是前菜而已
今天在圖像領域發表新的香蕉Pro出來炸場了
補一個我在FB中文社群看到極可怕的案例
入門級的美編這個週末夜難眠了
漢化組/台灣出版翻譯漫畫看過吧
來自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
真的變態的可怕
下面的案例感受一下
ChatGPT 888
按摩椅廣告圖(burri3188)
https://i.imgur.com/6BOGzPH.png
![[圖]](https://i.imgur.com/6BOGzPH.png)
![[圖]](https://i.imgur.com/6D04xqA.png)
Threads 室內設計師 33.shan.design 拿圖做渲染
https://i.imgur.com/drW90TN.jpeg
![[圖]](https://i.imgur.com/drW90TN.jpeg)
![[圖]](https://i.imgur.com/zbRtybWh.jpeg)
廣告圖解說(burri3188)
https://i.imgur.com/X9XIaRC.png
![[圖]](https://i.imgur.com/X9XIaRC.png)
![[圖]](https://i.imgur.com/iRNx1VJh.png)
家常便當菜隨手拍
https://i.imgur.com/dsW95kd.png
![[圖]](https://i.imgur.com/dsW95kdh.png)
![[圖]](https://i.imgur.com/zGcNZlmh.png)
廣告圖
https://i.imgur.com/KPFF64Z.jpeg
![[圖]](https://i.imgur.com/KPFF64Zh.jpeg)
===
這是我自己在路邊攤拍的滷肉飯
https://i.imgur.com/eOxnl7M.png
![[圖]](https://i.imgur.com/eOxnl7M.png)
請幫我生成專業的廣告照
https://i.imgur.com/tA6TETn.png
![[圖]](https://i.imgur.com/tA6TETn.png)
請讓金城武代言這碗滷肉飯
https://i.imgur.com/ohT85GX.png
![[圖]](https://i.imgur.com/ohT85GX.png)
其他案例
出師表+石牌
https://i.imgur.com/leh3cW7.jpeg
![[圖]](https://i.imgur.com/leh3cW7.jpeg)
饒河夜市+妹子
https://i.imgur.com/GOcRyhF.png
![[圖]](https://i.imgur.com/GOcRyhF.png)
吹風機廣告
https://i.imgur.com/NjSlNuu.png
![[圖]](https://i.imgur.com/NjSlNuuh.png)
![[圖]](https://i.imgur.com/QUFwmEqh.png)
![[圖]](https://i.imgur.com/2uRfcBuh.png)
![[圖]](https://i.imgur.com/bBpZPXLh.jpeg)
手沖咖啡圖 by Fox Hsiao
提示詞 : "請畫出一張手沖咖啡流程圖附上簡單說明,日本流行雜誌風格,但是說明文字
是台灣繁體中文"
https://i.imgur.com/EWUnPKn.png
![[圖]](https://i.imgur.com/EWUnPKn.png)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 212.102.40.177 (美國)
※ 作者: empliu 2025-11-21 01:05:41
※ 文章代碼(AID): #1f7qfhFx (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1763658347.A.3FB.html
※ 同主題文章:
● 11-21 01:05 ■ [新聞] Gemini 3 Pro Image:「Nano Banana Pro」重新定義 AI 影像生成
11-21 10:01 ■ Re: [新聞] Gemini 3 Pro Image:「Nano Banana Pro
推 : AI為什麼要加香菜1F 11/21 01:06
推 : 幹嘛偷拿我的照片2F 11/21 01:07
推 : 這邊魯豬肉了吧3F 11/21 01:09
推 : 要錢嗎,免費可以用嗎4F 11/21 01:10
→ : 變控肉飯5F 11/21 01:11
https://i.imgur.com/9dDCVHZ.png
![[圖]](https://i.imgur.com/9dDCVHZ.png)
→ : 如果免費,那GPT就GG6F 11/21 01:11
推 : 可以色色嗎7F 11/21 01:12
推 : NV 丸子8F 11/21 01:13
→ : 大安金城武表示憤怒9F 11/21 01:13
推 : 各方金城武集結10F 11/21 01:16
→ : 這灌水太嚴重了11F 11/21 01:18
推 : 香菜也太假了吧12F 11/21 01:20
→ : 焢肉跟雞蛋也很假
→ : 焢肉跟雞蛋也很假
推 : 香菜怎摸惹?香菜很好啊14F 11/21 01:22
推 : 這個算小控肉或紅燒肉飯,不過有些高級飯店的滷味15F 11/21 01:23
→ : 飯確實是這種型態
→ : 飯確實是這種型態
推 : 我迷人的笑容17F 11/21 01:23
推 : 做報告 超級好用18F 11/21 01:29
推 : 生成圖,openai還是更好19F 11/21 01:42
→ : 圖文不符,這樣拿去商業運用跟欺詐有甚麼不同?20F 11/21 01:42
→ : 這openai只好繼續加碼了,最後會不會賣給微軟21F 11/21 01:42
→ : 哪個客戶會接受這樣搞 不怕被告?22F 11/21 01:43
推 : 餓23F 11/21 01:54
推 : 加香菜真讚 AI很懂!24F 11/21 01:55
推 : 為什麼要加兩盤辣椒醬25F 11/21 02:23
噓 : AI 只有這種可以發揮?26F 11/21 02:24
補了一些案例
入門級的美編這個週末夜難眠了
漢化組/台灣翻譯漫畫看過看過吧
來自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
推 : 這滿滿的AI味27F 11/21 02:39
※ 編輯: empliu (212.102.40.177 美國), 11/21/2025 03:06:29噓 : 一看就是AI文28F 11/21 04:22
推 : 確實是grok弱點但我生成完美奶子時並不在意文字啥的29F 11/21 04:24
推 : open光金城武就卡關,哪裡強30F 11/21 04:28
推 : 你還在宮崎駿,人家直接金城武。31F 11/21 05:34
→ : 現在確實是gemini最強 但就跟海浪法師說的一樣32F 11/21 05:59
→ : 暫時的
→ : 暫時的
→ : 不過3pro轉好久 雖然我免費仔34F 11/21 06:08
噓 : 笑死 那滷肉飯明明就超強 肉燥飯還加魚鬆的超惡心好35F 11/21 06:17
→ : 嗎(誤
→ : 嗎(誤
推 : nano banana不就是奈米屌嗎37F 11/21 06:26
推 : 會讓人失業,然後失業率上升 市場就崩了38F 11/21 07:35
推 : 美術的要掰了39F 11/21 08:01
→ : 連設計的也岌岌可危
※ error405:轉錄至看板 AI_Art 11/21 08:15→ : 連設計的也岌岌可危
→ : 我照著提示詞作手沖咖啡流程圖 根本就是亂碼41F 11/21 09:07
推 : 推 感謝分享42F 11/21 10:34
推 : 好強==43F 11/21 10:34
推 : 確實很強44F 11/21 11:37
推 : openai現在至少還有sora2領先45F 11/21 11:47
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 36
作者 empliu 的最新發文:
- 根據外資高盛(Goldman Sachs)在最新發布的研究報告中,將台積電列入其亞太區首選 買進清單,並將目標價從 1,720 元大幅上調至 2,330 元,潛在漲幅高達 47%。這是繼日 前另一家 …97F 57推 4噓
台積電股價2日收盤大漲2.3%至1,585元,再創歷史新高,市值衝上新台幣41兆元。展望後 市,Aletheia資本公司已將台積電(2330)股票目標價從2,100元上修至2,400元,意味股 價還 …107F 59推 3噓
委內瑞拉總統馬杜洛遭到美軍逮捕,中國第一時間發聲譴責,痛批美方的這種霸權行徑, 已嚴重違反國際法,侵犯委內瑞拉主權。因委內瑞拉跟中國可說是盟友關係,在馬杜洛被 捕的前一天,他才跟中國特使團開心見面! …96F 43推 6噓
消費性電子產品製造業者及分析師警告,由於人工智慧(AI)對記憶體晶片的需求強勁, 帶動成本升高,手機、電腦及家電等消費電子產品的價格,2026年最多可能上漲20%。 戴爾、聯想、Raspberry …91F 40推 4噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享


