Re: [心得] 蘋果揭露人工智能並不思考 - Stock板

作者 pujos (lks)
標題 Re: [心得] 蘋果揭露人工智能並不思考
時間 Mon Jun 16 06:13:20 2025

這不是常識嗎？？？
你用LLM最常看到的不就免責條款
你有沒有想過
為什麼那些免責條款需要存在
僅僅是因為現在技術力不足？？？
才不是...

1.LLM會不會思考
https://ibb.co/k2gjs7rv

2.為什麼看起來像會思考
https://ibb.co/d0mZrSnH

3.這號稱的推理能力哪裡來的？
https://ibb.co/LX6T1PBd

4.結論
https://ibb.co/dsLMGynj

429 Too Many Requests

延伸問題
1.LLM究竟有無可能走向自我糾錯
不可能,其回答是立基於機率而非邏輯
永遠都會有一個高機率答案
https://ibb.co/wZdjy8sD

429 Too Many Requests

2.未來可能方向
https://ibb.co/0pz2NbSp

429 Too Many Requests

所以這條路未來是不可能走向AGI
這是LLM底層架構、邏輯
所決定的事
哪需要揭露
我還以為這是常識

因此你只要問LLM可以驗證的問題
它有很高機率回你個錯誤答案
因為它是猜一個看起來對的答案給你
而不是真的下去思考、計算
例如
543.21*543.21=？？？
上面這題
Gork、Gemini、GPT都可以是錯的

這才是為什麼要很小心用LLM的理由
整個思路、流程看起來都沒問題
但答案極有可能是錯的
結果錯在最智障的地方
計算式你給我用猜的...

※ 引述《huabandd (我是阿肥巴你頭)》之銘言：
: https://is.gd/U7lWC8
: 看到一個影片，非新聞報導，僅創作者想法
: 討論蘋果揭露關於人工智能當中的最大謊言
: 之前也看過一個影片指出
: AI無法產出指針在10:10以外的手錶
: （網路手錶圖片通常指針停留在10:10）
: 自己嘗試過幾次確實是這樣
: 因為AI的訓練是基於現有大量資料
: 去產生一個與大量資料相似的產物給你
: 無法產生未曾有過資料的產物
: （以上為個人猜測，若錯誤請指正）
: 雖然現在已有研究嘗試將AI接入人類神經元
: 未來思考的方式有可能因此改變
: 不再只是記憶，而是真正的推理
: （但是這好像也是一件滿恐怖的事情？）
: 如果說給AI一個圍棋組，但不教他玩法
: 也不讓他參考棋類玩法，讓他自行摸索
: 就像嬰兒拿到玩具後自己亂玩那樣
: AI能夠自行生成玩法是不是就算是成功？
: 中文翻譯
: 蘋果剛剛揭露了人工智慧中最大的謊言，即「思考」的假象，證明了像 Claude、Deepseek-
: R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問
: 題，而是創造了這些模型從未見過全新謎題。結果令人震驚。
: 對於簡單問題，標準 AI 模型表現優於昂貴的推理模型，同時消耗更少的資源。對於中等複
: 雜度問題，推理模型顯示出一些優勢，但對於模擬現實世界情境的高複雜度問題，兩種類型
: 的模型都崩潰到 0% 的準確度。
: 這是確鑿的證據：蘋果給予 AI 模型逐步的演算法，就像給某人食譜一樣，但它們仍在相同
: 的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據，得
: 出結論認為其行為最好用複雜的模式匹配來解釋。
: 簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔（Tower of Hanoi）謎題，模型
: 在超過 100 步的移動中成功了，但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶
: 模式，而不是進行邏輯推理。
: 隨著問題變得越來越難，「思考」模型使用的 token 越來越少，放棄得更快，而不是更深
: 入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤
: 前提上的。
: 公司將複雜的模式匹配宣傳為真正的推理，誤導消費者對 AI 能力的認知。我們離通用人工
: 智慧（AGI）的距離並沒有大家想像的那麼近；我們正在處理的是非常複雜的自動完成系統
: 。當先進的 AI 推理模型連遵循簡單指令都失敗時，我們是否正生活在一個建立在幻想之上
: 的 AI 炒作泡沫中？
: 英文原文
: Apple just exposed the biggest lie in AI with the illusion of "thinking," provin
: g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act
: ually think. Instead of recycling math problems, Apple created brand new puzzles
: these models had never seen. The results were shocking.
: For simple problems, standard AI models outperformed expensive reasoning models
: while using fewer resources. For medium complexity, reasoning models showed some
: advantage, but for high complexity problems that mirror real-world scenarios, b
: oth types collapsed to 0% accuracy.
: Here's the damning evidence: Apple gave AI models step-by-step algorithms, like
: giving someone a recipe, and they still failed at the same thresholds. This prov
: es they can't follow logical instructions. The study found no evidence of formal
: reasoning, concluding behavior is better explained by sophisticated pattern mat
: ching.
: Simply changing names and problems degraded performance dramatically. Apple test
: ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed
: at novel river crossing puzzles after just 4 moves. They memorized patterns rat
: her than reasoned logically.
: As problems got harder, "thinking" models used fewer tokens and gave up faster i
: nstead of thinking deeper. Even unlimited computational resources couldn't help.
: This exposes that billions in AI investment are based on false premises.
: Companies market sophisticated pattern matching as genuine reasoning, misleading
: consumers about AI capabilities. We are not as close to AGI as everyone thinks;
: we're dealing with very sophisticated autocomplete systems. When advanced AI re
: asoning models fail at following simple instructions, are we living in an AI hyp
: e bubble built on illusions?

-----
Sent from JPTT on my Xiaomi 23090RA98G.

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.242.134.228 (臺灣)
※ 作者: pujos 2025-06-16 06:13:20
※ 文章代碼(AID): #1eJqMHgW (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1750025617.A.AA0.html

※ 同主題文章:

[心得] 蘋果揭露人工智能並不思考

06-15 23:01 huabandd

Re: [心得] 蘋果揭露人工智能並不思考

06-16 01:32 LDPC

Re: [心得] 蘋果揭露人工智能並不思考

06-16 02:04 midas82539

Re: [心得] 蘋果揭露人工智能並不思考

06-16 06:13 pujos

Re: [心得] 蘋果揭露人工智能並不思考

06-16 08:41 winall

Re: [心得] 蘋果揭露人工智能並不思考

06-16 10:05 huabandd

Re: [心得] 蘋果揭露人工智能並不思考

06-16 10:19 xross

Re: [心得] 蘋果揭露人工智能並不思考

06-16 10:54 dreambreaken

Re: [心得] 蘋果揭露人工智能並不思考

06-16 10:55 chopinmozart

Re: [心得] 蘋果揭露人工智能並不思考

06-16 11:45 k1k1832002

Re: [心得] 蘋果揭露人工智能並不思考

06-16 12:17 midas82539

Re: [心得] 蘋果揭露人工智能並不思考

06-16 13:16 DarkerDuck

Re: [心得] 蘋果揭露人工智能並不思考

06-16 14:09 jodawa

※ 編輯: pujos (27.242.134.228 臺灣), 06/16/2025 06:27:39

推 ben108472: 錯的也就算了，還會講的跟真的一樣，而且隨著對話越多品質會非常有感的下降1F 06/16 06:33

推 centaurjr: 寫程式也很常出現啊，你給他一個冷門的轉換公式請他寫，他就會拿相似詞句的掰出來一整段
上週我拿一個多個if中間有幾段完全不會走到的，用省略完問他兩個是否一樣他也是答錯
浪費我好幾分鐘驗證3F 06/16 07:11

推 sunsamy: 講得跟真的一樣才是最致命的
我要花雙倍的時間去驗它所講的8F 06/16 07:17

推 abc12812: 免責條款和會不會思考是兩回事
chatgpt就只是推出來讓大家玩的玩具當然不負責10F 06/16 07:18

推 Eleganse: 提醒一下:你故意去考AI一個乘法　就像叫模具包水餃模具沒有錯你想吃水餃也沒有錯那什麼錯了很明顯12F 06/16 07:28

→ pujos: 那能問他什麼問題要不要先定義清楚，還乘法，哪個運14F 06/16 07:31

推 NTUT56: 叫chatgpt證明費馬小定理，限一行證完15F 06/16 07:31

→ pujos: 算不需要加減乘除，他算錯是使用者的錯??16F 06/16 07:31

→ NTUT56: 數學系可以gpt不行，群論一句話證完 trivial17F 06/16 07:32

→ pujos: 我程式超屌會算財務數據、會算工程數學...balabala，但是加減乘除錯，那是使用者的錯...洗地有需要洗成這樣嗎18F 06/16 07:32

推 MinatoFlash: 有常識是一回事證明常識為真是另一回事21F 06/16 07:36

→ FMANT: 我的ChatGPT：295,077.104122F 06/16 07:38

推 Samurai: 思考方式跟人腦一樣啊，考試的時候常常自己錯了也不知道，因為沒學到相關方法23F 06/16 07:43

→ bnn: 你人類小孩也是牙牙學語開始的...
小孩也會經歷過一個時期模仿發音但不知其所以然
小孩也會死背關連他記得的記憶亂回答一通25F 06/16 08:13

→ soem: 我覺得蠻有意思的點是，明明本質是LLM，大家最在乎的卻是1+1=2算錯 :)28F 06/16 08:15

→ bnn: 小孩也會看不懂有邊念邊(這參數很"像"XXX)30F 06/16 08:15

推 Eleganse: 感覺正上方那篇寫得不錯啊　樓主參考一下上一篇吧大家會看線型研究基本面算籌碼加減乘除也會錯啊你各位錯就可以　AI錯就不行　寬以律已是吧31F 06/16 08:15

→ bnn: 1+1=2 學生都是用背的包含九九乘法表不是思考34F 06/16 08:19

→ Eleganse: 上面也說的不錯　本質是LLM　最在乎他的1+1 ....35F 06/16 08:20

→ bnn: 沒人在進行算數的時候都還退回去集合論推導一遍
人只是調用他的記憶庫他背下來了1+1=2這件事情36F 06/16 08:20

噓 shinewind: 免責條款是兩回事吧...
就算是人都會有錯誤的機會
就像醫生幫你開刀，難不成失敗就告？
我不覺得LLM可以實現AGI，但這是兩回事38F 06/16 08:23

推 centaurjr: 所以12345x54321 樓上背看看多少?42F 06/16 08:28

作者 pujos 的最新發文:

+25 Re: [新聞] 甲骨文股價暴跌超10%！訂單積壓越來越多「燒錢」砸AI - Stock 板

作者: pujos 1.175.23.100 (台灣) 2025-12-14 17:04:31

這玩意以現在技術沒有難點但它本質是在挖人祖墳所以理所當然會被全線封殺高科技公司五個字是好聽的說法本質都是廣告事業谷狗對adguard一類影響其收入的咚咚照樣封殺廣告事業如果一個指令 …

146F 26推 1噓
-25 Re: [提問] 損失到何種程度，你能接受政府投降? - Military 板

作者: pujos 114.27.161.13 (台灣) 2025-12-12 06:21:45

203F 9推 34噓
+20 Re: [討論] 豆包AI手機原理深度分析 - MobileComm 板

作者: pujos 1.175.44.69 (台灣) 2025-12-10 17:10:43

這手機最嚴重的問題跟隱私毫無關係影響最大的是各大廠最重要的收入廣告事業如果我一個指令就可以讓手機自動跨平台作業比如自動比價,篩選產品那各種廣告分頁，競價廣告位會瞬間大打折扣甚至變成垃 …

93F 23推 3噓
Re: [新聞] 不只設定錯誤！鯛魚排烏龍案食藥署揪實驗室「3大疏失」：帳密全員共用 - Gossiping 板

作者: pujos 118.171.200.49 (台灣) 2025-12-06 17:22:23

12F 1噓
+3 Re: [新聞] 台灣9%兒童受ADHD影響卻少有人治療醫：早期介入可改變人生 - Gossiping 板

作者: pujos 118.171.200.49 (台灣) 2025-12-06 11:01:09

14F 5推 2噓

點此顯示更多發文記錄