作者 error405 (流河=L)標題 [閒聊] GPT Image 1.5 評測摘要時間 Wed Dec 17 12:02:42 2025
https://www.youtube.com/watch?v=75b_5Y_jipg
這部影片主要評測了 OpenAI 最新發布的圖像生成模型 GPT Image 1.5,並將其與目前被
認為是最強的圖像模型 Nano Banana Pro(根據影片內容推測指 Google Imagen 3)進行
了詳細的對比測試。
以下是影片的重點摘要:
1. 核心介紹
GPT Image 1.5:OpenAI 的最新圖像生成模型(可能是 DALL-E 3 的升級版)。
特點:免費開放給所有用戶(包括免費用戶),消除了前代模型常見的「黃色色
調 (Yellow tinge)」,文字渲染能力提升。
Nano Banana Pro:影片中作為對比的標竿模型(YouTuber 稱其為目前最強,且影片
結尾提到「Google set the bar way too high」,推測指 Google Imagen 3)。
2. 對比測試結果
影片透過多個高難度提示詞(Prompt)進行了殘酷的對決,結果如下:
GPT Image 1.5 勝出的項目 (:
表情與情緒:在描繪複雜情緒(如寬慰、期待、嫉妒、懷舊)時,GPT Image
1.5 的表現比對手更精準生動。
數學作業 (手寫字):能用逼真的手寫字跡解出數學題,且未隨意更改背景,效
果優於對手。
介面生成 (UI):在生成 YouTube 搜尋結果頁面時,拼字錯誤較少,縮圖和排版
更準確。
可訪問性:完全免費,使用門檻低。
Nano Banana Pro (Google Imagen 3) 勝出的項目 ():
世界知識與真實度:在生成特定生物(如罕見青蛙)、知名人物(名人/富豪)
以及遊戲畫面(如 Starcraft)時,準確度遠高於 GPT。GPT 常有「守門員
(Guardrails)」限制或生成錯誤特徵。
空間與技術理解:
室內設計:能準確還原房間照片的平面圖(Floor plan),GPT 則完全搞錯
空間配置。
圖表與數據:能將複雜的表格截圖精準轉換為統計圖表(Bar chart),並
正確計算比例,展現了強大的邏輯與視覺理解能力。
科學圖像:在生成熱成像圖(Thermal map)、深度圖(Depth map)和分割
圖時,準確度顯著領先。
漫畫翻譯/上色:在保留原漫畫細節的同時進行翻譯和上色,效果優於 GPT
。
圖解原理:在繪製神經網絡架構圖(Transformer diagram)時,結構正確且清
晰,GPT 則生成了錯誤的圖表。
平手或皆失敗:
大家來找碴 (Where's Waldo):兩者生成的臉部細節都崩壞,任務失敗。
時鐘與液體:生成「11:15 的時鐘與倒滿的酒杯」,兩者都有小瑕疵。
復古遊戲重製:將舊遊戲畫面轉為高清重製版,兩者表現相當。
3. 總結評價
GPT Image 1.5 是一個巨大的進步,修正了前代的色偏問題,文字和表情生成能力很
強,且免費可用,是很好的入門選擇。
Nano Banana Pro (Google Imagen 3) 仍然是目前的圖像生成王者 (King)。它在真
實感、世界知識、空間邏輯以及處理複雜數據圖表的能力上,依然難以被超越。
4. 使用資訊
GPT Image 1.5 已經向所有 ChatGPT 用戶推送(包括免費用戶)。
支援最高 1.5K 解析度,需透過提示詞指定長寬比(如 Horizontal/Vertical)。
--
gemini整理
gpt終於擺脫奇怪的黃色了嗎
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.245.116 (臺灣)
※ 作者: error405 2025-12-17 12:02:42
※ 文章代碼(AID): #1fGYjaRB (AI_Art)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1765944164.A.6CB.html
推 Bustycat: GPT Image 1.5在Design Arena四個榜單的三個奪冠,
僅修圖屈居第二;LMArena文生圖也奪冠,然而在修圖
方面是ChatGPT用的版本第一、API接入的掉在第四1F 12/17 12:37
→ error405: 看了範例不覺得它該第一 嗯時間會證明4F 12/17 12:39
推 Bustycat: ChatGPT目前生圖都是1.5了,丟到檢測工具都是和1不
同結果5F 12/17 12:39
推 Bustycat: 這篇似乎不知道Imagen是另一系列模型、並非Gemini?9F 12/17 21:19
--