回看板
Disp BBS
作者
strlen
(strlen)
標題
Re: [新聞] ChatGPT-5波折超乎想象!奧特曼急回應:
時間
Sun Aug 10 15:11:20 2025
放大假閒來無事
正好一堆AI公司推新品
無職碼農就再來測試測試
半年前DS之亂時
測過讓各家AI寫一個註冊頁
現在我把同樣提示詞再讓各家AI做一次
看看有多少進步
Gemini 2.5 pro:
https://thelonesomeera.com/signuptest/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/signuptest/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/signuptest/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/signuptest/grok.html
Deepseek R1:
https://thelonesomeera.com/signuptest/deepseek.html
Qwen:
https://thelonesomeera.com/signuptest/qwen.html
以上提示詞都完全一樣
各家表現大差不差
但多多少少都有些小bug
這部份就算大家都進步到差不多的程度
既然過了半年
那就要有相對應更進階的測試 對吧?
所以這次追加了以下提示詞
「請使用 HTML 前端技術
製作一個模擬太陽系的網頁
相關程式請集中在一個 html 檔案」
Gemini 2.5 pro:
https://thelonesomeera.com/solarsystem/gemini.html
ChatGPT 5 thinking:
https://thelonesomeera.com/solarsystem/chatgpt.html
Claude sonnet 4:
https://thelonesomeera.com/solarsystem/claude.html
Grok 4 Heavy:
https://thelonesomeera.com/solarsystem/grok.html
Deepseek R1:
https://thelonesomeera.com/solarsystem/deepseek.html
Qwen:
https://thelonesomeera.com/solarsystem/qwen.html
喔喔喔
這個需求就蠻有鑑別度了
大家可以自己比較一下呵呵
方便瀏覽的集成頁:
https://thelonesomeera.com/ai-hub.html
最後是股點
這樣測下來
有點讓我想出掉狗家股票勒
狗狗
加油
好唄?
嗯.....
備註:
以上網頁完全沒有寫到任何一行程式碼
全都是複製貼上
應該說我連看都沒看...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.12.18 (臺灣)
※ 作者:
strlen
2025-08-10 15:11:20
※ 文章代碼(AID): #1ec4Ohcj (Stock)
※ 文章網址:
https://www.ptt.cc/bbs/Stock/M.1754809899.A.9AD.html
※ 同主題文章:
[新聞] ChatGPT-5波折超乎想象!奧特曼急回應:4o重新上陣 團隊補救中
08-09 16:53
xephon
Re: [新聞] ChatGPT-5波折超乎想象!奧特曼急回應:
08-10 15:11
strlen
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:15:12
推
lianli1024
: 狗家在幹嘛笑死
1F 08/10 15:15
→
LDPC
: QQ 好強 大大
2F 08/10 15:17
碼農吃飽太閒而已 不強 QQ
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:19:27
推
ga0952briel
: 狗家還以為是太陽要把大家吃掉XD
3F 08/10 15:20
推
sdbb
: 好強,謝謝,好險上週沒有加碼googl
或說各家各有擅長
4F 08/10 15:21
→
LDPC
: 前陣子西洋棋大賽 狗狗被grok幹掉了QQ
https://reurl.cc/axLEaD
6F 08/10 15:22
AI 棋王爭霸戰:Grok-4 與 o3 決戰巔峰,Kaggle 西洋棋大賽戰況全解析 | Communeify
一場前所未有的 AI 大戰在西洋棋盤上展開!Google 的 Gemini、xAI 的 Grok、OpenAI 的 o3 和 Anthropic 的 Claude 等頂尖大型語言模型 (LLM) 齊聚 Kaggle Game Arena,展開激烈廝殺。本文將帶您深入解析從第一輪到決賽的精彩戰況,見證 ...
推
capssan
: 我覺得辦比賽一定是未來AI的看點之一
問題就是要辦什麼比賽了
8F 08/10 15:35
推
sdbb
: Ani跳啦啦隊大賽
10F 08/10 15:38
→
KANGTA23
…
噓
KANGTA23
: 臭谷狗就是噓而已沒啥好說了,比柵欄仔還不如
11F 08/10 15:39
哥 狗我也有持骨齁...
推
TaiwanUp
: GPT的還是最完整 軌道可以縮放 只是太陽大小不會變
軌道縮太小會像是類地行星都被太陽包覆
GPTc96u.3
GPT還有時間 冥王星勾選
能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini
12F 08/10 16:02
※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 16:09:53
→
TaiwanUp
: 我看到的Qwen永遠九星連珠
17F 08/10 16:10
→
lavign
: 棋類完全資訊遊戲都有先手優勢,不讓子或雙循環根
本不準
18F 08/10 16:22
→
eemail
: 就出一題而已
20F 08/10 16:28
→
tw19930419
: 到時候Google又有更強模型出來,然後配他的全家桶
你只能哭在路邊
21F 08/10 16:31
→
watashino
: 用同一個prompt不一定是個好主意 能看看具體的promp
t嗎
23F 08/10 16:39
→
TaiwanUp
: 只有GPT軌道稍微正確 其他的九軌道都等距 不合理
25F 08/10 16:45
推
mamorui
: 我現在用Cloude
26F 08/10 16:58
→
qxpbyd
: Gemini2.5pro你是用AI Studio的還是Gemini版的?
27F 08/10 17:03
噓
champion0922
: 一直撞一直爽
28F 08/10 17:03
→
qxpbyd
: 我用你的prompt 太陽系不會錯成那樣
29F 08/10 17:03
推
stepnight
: 窩只能說寫Code,Gemini 就是一坨
30F 08/10 17:07
推
jerrychuang
: 可是notebooklm很好用耶
31F 08/10 17:22
推
TameFoxx
: Gemini強項就不在coding
32F 08/10 18:18
噓
maplefff
: 這種題目沒有辦法體現Gemini 2.5 Pro 1M上下文優勢
等到你的專案足夠複雜, 足夠大, 其他模型如同不停
失憶的新人, 必須反覆閱讀技術文檔, 你就知道差距了
33F 08/10 18:24
→
lavign
: 有限空間解的問題測試才能知道基本推理能力的強弱
36F 08/10 18:30
→
maplefff
: 這種問題等於考99x99乘法表來考驗哈佛,劍橋,史丹佛
數學博士生的數學能力. 除了顯示誰99x99乘法表背得
熟以外, 跟數學能力根本無關
37F 08/10 18:34
推
Adrian
: Gemini 畫圖很不錯 其他爛爛的
40F 08/10 19:11
→
Atwo
: 很有趣耶 讓我想試做看看托勒密的地心說模型
41F 08/10 20:05
推
KTFGU
: 寫程式不要用google
42F 08/10 21:34
→
medama
: 沒有冥王星嗎
43F 08/11 00:46
推
donkilu
: Gemini真的很搞
44F 08/11 02:37
推
Toge
: Gemini喔,去 reddit 找一堆崩潰圖,還會給你刪 co
de 呵呵
之前用它還直接給我 git reset --hard,幹
45F 08/11 07:27
推
cvn21
: Gemini 適合做大量重複無聊的工作,比如說提取超長
文中出現多次,不同但有一定特徵的資料
這種用GPT 都會偷懶,找個三四個就開始瞎掰
用在研究上把亂七八糟raw data轉換成表格還行,這種
超無聊的工作用GPT從來沒弄好過
48F 08/11 09:10
推
staytuned74
: 你把題目換成解微積分給他pdf 考古題,最強可能就
變成pro2.5了
其他家可能解兩題就開始像上面講的偷懶不解了
然後gpt5 現在糟糕到吃不進去非文字解析pdf 其他家
都可,就知道出多大包了
53F 08/11 11:16
--
作者 strlen 的最新發文:
+58
[新聞] AMD 軟體縮小與 CUDA 差距,專家指NVIDIA - Stock 板
作者:
strlen
49.216.167.215
(台灣)
2025-08-22 15:29:52
AI 解決方案開發商 Tiny Corp 近日表示,AMD 在軟體方面取得重大進步,已大幅縮小 與 NVIDIA CUDA 系統的差距,甚至可能在 NVIDIA 出現技術失誤時超越其在 AI 市場的 …
150F 63推 5噓
+6
- Stock 板
作者:
strlen
1.160.34.204
(台灣)
2025-08-21 21:10:08
29F 8推 2噓
+15
Re: [請益] 為什市場一片悲觀 - Stock 板
作者:
strlen
1.160.22.105
(台灣)
2025-08-17 16:22:56
35F 16推 1噓
+40
[新聞] 少了輝達晶片就是不行?DeepSeek R2傳延遲推出 跟「這公司」有關 - Stock 板
作者:
strlen
1.160.15.191
(台灣)
2025-08-14 18:59:49
大陸人工智慧(AI)初創公司DeepSeek據傳將延遲推出新AI模型DeepSeek-R2大模型。英 國金融時報引述消息人士指出,DeepSeek因使用華為晶片訓練失敗,因而推遲發布新模型 ,亦反映大 …
102F 43推 3噓
+36
Re: [新聞] 真相驚人!台灣人還不習慣電子支付嗎?金管會內部數據曝光 - Stock 板
作者:
strlen
1.160.15.191
(台灣)
2025-08-14 00:27:14
我想習慣但環境不讓我習慣 我有什麼辦法? 外面一大堆店家都只收現金 不然就是只有某一種pay其它都沒有 喔我們只有賴配喔 喔我們只有台灣配喔 喔我們只有街口喔 喔我沒只有信用卡喔 什麼配什麼配好幾種 …
233F 67推 31噓
點此顯示更多發文記錄