Re: [新聞] ChatGPT-5波折超乎想象！奧特曼急回應： - Stock板

作者 strlen (strlen)
標題 Re: [新聞] ChatGPT-5波折超乎想象！奧特曼急回應：
時間 Sun Aug 10 15:11:20 2025

放大假閒來無事
正好一堆AI公司推新品
無職碼農就再來測試測試

半年前DS之亂時
測過讓各家AI寫一個註冊頁
現在我把同樣提示詞再讓各家AI做一次
看看有多少進步

Gemini 2.5 pro:
https://thelonesomeera.com/signuptest/gemini.html

ChatGPT 5 thinking:
https://thelonesomeera.com/signuptest/chatgpt.html

Claude sonnet 4:
https://thelonesomeera.com/signuptest/claude.html

Grok 4 Heavy:
https://thelonesomeera.com/signuptest/grok.html

Deepseek R1:
https://thelonesomeera.com/signuptest/deepseek.html

Qwen:
https://thelonesomeera.com/signuptest/qwen.html

以上提示詞都完全一樣
各家表現大差不差
但多多少少都有些小bug
這部份就算大家都進步到差不多的程度

既然過了半年
那就要有相對應更進階的測試對吧？
所以這次追加了以下提示詞

「請使用 HTML 前端技術
製作一個模擬太陽系的網頁
相關程式請集中在一個 html 檔案」

Gemini 2.5 pro:
https://thelonesomeera.com/solarsystem/gemini.html

ChatGPT 5 thinking:
https://thelonesomeera.com/solarsystem/chatgpt.html

Claude sonnet 4:
https://thelonesomeera.com/solarsystem/claude.html

Grok 4 Heavy:
https://thelonesomeera.com/solarsystem/grok.html

Deepseek R1:
https://thelonesomeera.com/solarsystem/deepseek.html

Qwen:
https://thelonesomeera.com/solarsystem/qwen.html

喔喔喔
這個需求就蠻有鑑別度了
大家可以自己比較一下呵呵

方便瀏覽的集成頁：
https://thelonesomeera.com/ai-hub.html

最後是股點
這樣測下來
有點讓我想出掉狗家股票勒
狗狗
加油
好唄？
嗯.....

備註：
以上網頁完全沒有寫到任何一行程式碼
全都是複製貼上
應該說我連看都沒看...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.12.18 (臺灣)
※ 作者: strlen 2025-08-10 15:11:20
※ 文章代碼(AID): #1ec4Ohcj (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1754809899.A.9AD.html

※ 同主題文章:

[新聞] ChatGPT-5波折超乎想象！奧特曼急回應：4o重新上陣團隊補救中

08-09 16:53 xephon

Re: [新聞] ChatGPT-5波折超乎想象！奧特曼急回應：

08-10 15:11 strlen

※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:15:12

推 lianli1024: 狗家在幹嘛笑死1F 08/10 15:15

→ LDPC: QQ 好強大大2F 08/10 15:17

碼農吃飽太閒而已不強 QQ
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:19:27

推 ga0952briel: 狗家還以為是太陽要把大家吃掉XD3F 08/10 15:20

推 sdbb: 好強，謝謝，好險上週沒有加碼googl
或說各家各有擅長4F 08/10 15:21

→ LDPC: 前陣子西洋棋大賽狗狗被grok幹掉了QQ
https://reurl.cc/axLEaD6F 08/10 15:22

AI 棋王爭霸戰：Grok-4 與 o3 決戰巔峰，Kaggle 西洋棋大賽戰況全解析 | Communeify 一場前所未有的 AI 大戰在西洋棋盤上展開！Google 的 Gemini、xAI 的 Grok、OpenAI 的 o3 和 Anthropic 的 Claude 等頂尖大型語言模型 (LLM) 齊聚 Kaggle Game Arena，展開激烈廝殺。本文將帶您深入解析從第一輪到決賽的精彩戰況，見證 ...

推 capssan: 我覺得辦比賽一定是未來AI的看點之一
問題就是要辦什麼比賽了8F 08/10 15:35

推 sdbb: Ani跳啦啦隊大賽10F 08/10 15:38

噓 KANGTA23: 臭谷狗就是噓而已沒啥好說了，比柵欄仔還不如11F 08/10 15:39

哥狗我也有持骨齁...

推 TaiwanUp: GPT的還是最完整軌道可以縮放只是太陽大小不會變軌道縮太小會像是類地行星都被太陽包覆
GPTc96u.3
GPT還有時間冥王星勾選
能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini12F 08/10 16:02

※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 16:09:53

→ TaiwanUp: 我看到的Qwen永遠九星連珠17F 08/10 16:10

→ lavign: 棋類完全資訊遊戲都有先手優勢，不讓子或雙循環根本不準18F 08/10 16:22

→ eemail: 就出一題而已20F 08/10 16:28

→ tw19930419: 到時候Google又有更強模型出來，然後配他的全家桶你只能哭在路邊21F 08/10 16:31

→ watashino: 用同一個prompt不一定是個好主意能看看具體的prompt嗎23F 08/10 16:39

→ TaiwanUp: 只有GPT軌道稍微正確其他的九軌道都等距不合理25F 08/10 16:45

推 mamorui: 我現在用Cloude26F 08/10 16:58

→ qxpbyd: Gemini2.5pro你是用AI Studio的還是Gemini版的?27F 08/10 17:03

噓 champion0922: 一直撞一直爽28F 08/10 17:03

→ qxpbyd: 我用你的prompt 太陽系不會錯成那樣29F 08/10 17:03

推 stepnight: 窩只能說寫Code，Gemini 就是一坨30F 08/10 17:07

推 jerrychuang: 可是notebooklm很好用耶31F 08/10 17:22

推 TameFoxx: Gemini強項就不在coding32F 08/10 18:18

噓 maplefff: 這種題目沒有辦法體現Gemini 2.5 Pro 1M上下文優勢等到你的專案足夠複雜, 足夠大, 其他模型如同不停失憶的新人, 必須反覆閱讀技術文檔, 你就知道差距了33F 08/10 18:24

→ lavign: 有限空間解的問題測試才能知道基本推理能力的強弱36F 08/10 18:30

→ maplefff: 這種問題等於考99x99乘法表來考驗哈佛,劍橋,史丹佛數學博士生的數學能力. 除了顯示誰99x99乘法表背得熟以外, 跟數學能力根本無關37F 08/10 18:34

推 Adrian: Gemini 畫圖很不錯其他爛爛的40F 08/10 19:11

→ Atwo: 很有趣耶讓我想試做看看托勒密的地心說模型41F 08/10 20:05

推 KTFGU: 寫程式不要用google42F 08/10 21:34

→ medama: 沒有冥王星嗎43F 08/11 00:46

推 donkilu: Gemini真的很搞44F 08/11 02:37

推 Toge: Gemini喔，去 reddit 找一堆崩潰圖，還會給你刪 code 呵呵
之前用它還直接給我 git reset --hard，幹45F 08/11 07:27

推 cvn21: Gemini 適合做大量重複無聊的工作，比如說提取超長文中出現多次，不同但有一定特徵的資料
這種用GPT 都會偷懶，找個三四個就開始瞎掰
用在研究上把亂七八糟raw data轉換成表格還行，這種超無聊的工作用GPT從來沒弄好過48F 08/11 09:10

推 staytuned74: 你把題目換成解微積分給他pdf 考古題，最強可能就變成pro2.5了
其他家可能解兩題就開始像上面講的偷懶不解了
然後gpt5 現在糟糕到吃不進去非文字解析pdf 其他家都可，就知道出多大包了53F 08/11 11:16

作者 strlen 的最新發文:

+33 [新聞] 財報〉甲骨文雲端收入猛增、上修財測盤後暴漲10% - Stock 板

作者: strlen 1.160.6.1 (台灣) 2026-03-11 09:51:37

甲骨文 (Oracle)(ORCL-US) 上季雲端營收猛增 44%，並預估新一會計年度的營收優於市場預期，顯然正在兌現人工智慧 (AI) 訂單的承諾，周二 (10 日) 盤後大漲 10%。財測 …

74F 37推 4噓
+25 Re: [新聞] Oracle 和 OpenAI 終止擴建旗艦資料中心的計劃 - Stock 板

作者: strlen 1.160.6.1 (台灣) 2026-03-10 15:57:57

三天前的鬼故事撿骨文剛剛正式回應以下僅貼機翻：近期媒體對我們資料中心的通報反映出對人工智慧資料中心的建構和運作方式存在根本性的誤解。 Oracle 的人工智慧資料中心，無論是現有的還是未來的 …

42F 27推 2噓
+30 Re: [新聞] Anthropic 最新聲明 - Stock 板

作者: strlen 1.160.12.251 (台灣) 2026-02-27 11:46:50

沒錯已經很多人看清Anthropic了但還是很多死忠仔拼命吹因為這家的行銷策略跟另一間A家有點類似邪教般的挑起對立、製造爭端藉此篩選客群看清A家的人會離開相對的留下來的就是再怎麼割也會 …

92F 32推 2噓
+9 [新聞]最老語言COBOL恐滅絕？新Claude Code太強 IBM股價重挫13% - Soft_Job 板

作者: strlen 1.160.12.251 (台灣) 2026-02-24 11:51:50

64F 13推 4噓
+27 Re: [請益] 最近美股跌的原因是什麼？ - Stock 板

作者: strlen 1.160.9.185 (台灣) 2026-02-06 12:50:06

先來個四大天王比較圖基本上大家都是千億鎂金起跳了而且財報也都不錯穩穩賺不好嗎？為什麼錢是越砸越多？股東們從2年前就開始擔心巨額投資怎麼有辦法回收？賺再多也不夠啊？是這樣也不是這樣 …

76F 27推

點此顯示更多發文記錄