Re: [心得] AI的人性 - Soft_Job板

作者 oopFoo (3d)
標題 Re: [心得] AI的人性
時間 Tue Apr 7 03:06:40 2026

二月後，anthropics改了一些東東
https://news.ycombinator.com/item?id=47664442

Hey all, Boris from the Claude Code team here. I just responded on the issue, an... | Hacker News

adaptive thinking default (Feb 9)
Medium effort (85) default on Opus 4.6 (Mar 3)

事情鬧大是因為
https://github.com/anthropics/claude-code/issues/42796

[MODEL] Claude Code is unusable for complex engineering tasks with the Feb updates · Issue #42796 · anthropics/claude-code · GitHub Preflight Checklist I have searched existing issues for similar behavior reports This report does NOT contain sensitive information (API keys, passwor ...

說Claude變很笨，這段時間寫的codes現在正在靠Codex5.4重新改寫。

寫issue的人說，那些defaults都改過，還是一樣笨。八點檔繼續演

※ 引述《cateran (雲川閒步)》之銘言：
: 最近工作上解一個問題用opus 4.6發生一個快讓我笑死的狀況
: 背景是本公司巨大的c++應用程式在某個情況下crash
: 餵log請AI檢查後很快就查查資料改好一版
: 說是因為某某某情況所以本來的map找不到查詢的指標
: 回傳一個out of bound的index value
: 新程式新增了一段進階檢查的迴圈應對特殊狀況
: 改好後跑原本測資還是crash
: 把log餵回AI請他再看看
: 結果第二版竟然把之前的修改全部拿掉
: 只在上層呼叫端加一個fallback說指標找不到就直接回傳0
: 還沾沾自喜跟我說阿這樣就絕對不會crash了很棒吧
: 我只好質問agent 阿你這樣只是把問題掩蓋住這樣對嗎？
: AI也毫不掩飾的說你說得沒錯我不該這樣
: 最後AI給出的第三版總算把問題從底層修好
: 不禁在想第二版那種天兵解法的思路到底是怎麼出來的
: 是因為訓練資料也包含一些菜鳥工程師的程式嗎
: 有沒有AI大神可以解釋這種狀況
你確定有改好？其實埋了更多炸彈？

news.ycombinator 那篇很精彩，一堆人事後諸葛說我也發現Claude變笨了，然後一推人說reddit早就吵翻了。

其實還滿慘烈的。這麼多人用的ai，變笨，使用的人埋了一堆炸彈，現在要如何拆彈？

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.66.74 (臺灣)
※ 作者: oopFoo 2026-04-07 03:06:40
※ 文章代碼(AID): #1fr0H7zs (Soft_Job)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1775502407.A.F76.html

※ 同主題文章:

[心得] AI的人性

04-04 10:59 cateran

Re: [心得] AI的人性

04-07 03:06 oopFoo

推 jobintan: 往好的方向思考，這是給人類工程師製造機會，給想著用AI去人類的慣老闆們賞一巴掌。wwwww1F 04/07 07:43

短期內還是蠻悲觀的。亞馬的90-day reset，沒有造成震撼，看來每個慣老闆要自己學到教訓。

推 yamakazi: 裝笨讓你優越感一下3F 04/07 10:36

→ Obama19: 有新模型快出來都會變笨都演幾次了4F 04/07 10:40

推 yamakazi: 就跟新手機新晶片新的方案出發出發之前，舊的偷降速降頻一樣，擠牙膏5F 04/07 10:44

→ freeunixer: 還好我前兩個月都在打混沒用 ai (~誤7F 04/07 13:20

推 sarsman: 說到底不就沒在review才導致這樣==8F 04/07 13:25

噓 USD5566: 重點不是笨不笨而是你們是工程師然後居然跟一般人一樣在討論語言模型根本不存在的人格人性zzzzz 拜託這個板是認真的嗎9F 04/07 15:35

就像根本沒有thinking/reasoning模式，ai公司也一直重複。明明就是增加tokens來達成增加搜尋範圍來找到更適合的答案。

推 zxc8787: 樓上說的有道理==12F 04/07 15:54

→ peterturtle: 我們還在機台上放乖乖呢，討論個人格人性怎麼了 www13F 04/07 17:54

推 ManInBlack: 把物體擬人化確實是有幫助大家了解抽象的東西啦
一本正經胡說/取悅使用者/降低思考強強度真的蠻「人」的XD14F 04/07 18:54

推 yamakazi: 這不是腦補Karpathy用自動補全不是用agent的原Po嗎？
之前還腦補使用claude code只是下prompt不是用agent
把claude code想成下prompt和自動補全17F 04/07 21:05

推 abccbaandy: 笨不笨難說，但Opus確實貴...20F 04/07 21:18

→ superpandal: 對於工程師而言本來就有更適合的工具除非本來就不會把這類工具當浮木的才會一直吹效率工具本身也是工程師私有遠控CP值才高
我現在還要加一個別人永遠看不懂的操作才安全即便從椅背後看21F 04/07 22:32

llms當成輔助，其實還不錯。但現在的用法太勉強了
※ 編輯: oopFoo (58.114.66.74 臺灣), 04/08/2026 08:09:46
--

作者 oopFoo 的最新發文:

+8 Re: [心得] AI的人性 - Soft_Job 板

作者: oopFoo 58.114.66.74 (台灣) 2026-04-07 03:06:40

25F 9推 1噓
+27 Re: [新聞] 台灣團隊作品《沉默之丘f》獲法米通大獎 - Steam 板

作者: oopFoo 36.224.199.211 (台灣) 2026-03-23 14:38:25

泥巴明明就是當初樂陞垮台後，執行長Jean-Marc Morel想辦法把樂陞的人成功整合的公司。然後"沉默之丘f"，明明就是泥巴開發，就是有人不承認。說真的，台灣遊戲開發，真的 …

68F 28推 1噓
+9 Re: [情報] 微軟:我們對Windows品質的承諾 - PC_Shopping 板

作者: oopFoo 58.114.66.74 (台灣) 2026-03-21 08:38:33

132F 22推 13噓
-21 Re: [閒聊] 我的9950x3d也燒啦 - PC_Shopping 板

作者: oopFoo 58.114.66.74 (台灣) 2026-03-19 07:32:40

55F 6推 27噓
+8 Re: [新聞] 超過75%德國人不想買Tesla 原因竟是「政治立場」 - car 板

作者: oopFoo 36.224.241.14 (台灣) 2026-03-13 12:32:16

25F 10推 2噓

點此顯示更多發文記錄