※ 本文轉寄自 ptt.cc 更新時間: 2025-07-17 18:03:10
看板 Soft_Job
作者 標題 [新聞] 資深軟體工程師用Cursor工作效率降19%
時間 Wed Jul 16 09:11:00 2025
https://www.bnext.com.tw/article/83885/ai-productivity-drop
AI變豬隊友?資深軟體工程師用Cursor「工作效率降19%」:背後原因是?導入AI錯了嗎?
2025.07.15
資料來源:METR、路透社
責任編輯:李先泰
內文:
重點一:2025年初AI工具讓資深開源開發者生產力下降19%,顛覆普遍預期。
重點二:研究採用嚴謹隨機對照試驗(RCT),直接測量AI在真實軟體開發情境的影響。
重點三:研究結果與AI基準測試及開發者主觀經驗存在顯著差異,凸顯評估AI效益需多元視
角。
生成式AI近年有越來越「聰明」的趨勢,不少企業甚至因為導入AI而縮減組織人員規模。但
對於公司行號來說,真的只要「無腦導入AI」,就可以讓生產力大躍升嗎?答案可能沒這麼
簡單。
對於公司行號來說,真的只要「無腦導入AI」,就可以讓生產力大躍升嗎?答案可能沒這麼
簡單。
7月10日,一項由非營利研究機構METR(Model Evaluation & Threat Research)主導的研
究顯示,2025年初問世的AI工具,包括Cursor Pro與Claude 3.5/3.7 Sonnet等前沿模型,
實際應用於資深開源開發者日常開發工作時,非但未能提升生產力,反而導致效率平均下降
19%。
究顯示,2025年初問世的AI工具,包括Cursor Pro與Claude 3.5/3.7 Sonnet等前沿模型,
實際應用於資深開源開發者日常開發工作時,非但未能提升生產力,反而導致效率平均下降
19%。
這份研究的隨機對照試驗(Randomized Controlled Trial, RCT)結果,狠狠打臉產業普遍
認為「AI將大幅加速軟體開發」的主流觀點。白話來說,就是強制相對資深的老手工程師使
用AI,反而可能拖累他們的工作速度。
認為「AI將大幅加速軟體開發」的主流觀點。白話來說,就是強制相對資深的老手工程師使
用AI,反而可能拖累他們的工作速度。
https://i.meee.com.tw/f063wYI.jpg
![[圖]](https://i.meee.com.tw/f063wYI.jpg)
時,所需時間反而增加了 19%。
問題是,為什麼有如此反直覺的結果?是在使用AI的過程中,出了什麼差錯嗎?
拖累老手工程師的5大潛在原因
為深入分析AI工具對軟體開發生產力的實際影響,研究團隊招募了16位長期參與大型開源專
案(平均22,000顆GitHub星、百萬行程式碼)的資深開發者,針對246個專案真實議題(如
錯誤修復、功能開發、程式碼重構),隨機分配為「允許使用AI」與「禁止使用AI」兩組。
開發者可自由選擇AI工具(主要為Cursor Pro搭配Claude 3.5/3.7 Sonnet)。同時,開發
者在執行任務時全程錄影,並自行回報所需的總實作時間,並比較同一批開發者在「無AI輔
助」下完成任務的時間差異,並排除潛在實驗偏誤。
案(平均22,000顆GitHub星、百萬行程式碼)的資深開發者,針對246個專案真實議題(如
錯誤修復、功能開發、程式碼重構),隨機分配為「允許使用AI」與「禁止使用AI」兩組。
開發者可自由選擇AI工具(主要為Cursor Pro搭配Claude 3.5/3.7 Sonnet)。同時,開發
者在執行任務時全程錄影,並自行回報所需的總實作時間,並比較同一批開發者在「無AI輔
助」下完成任務的時間差異,並排除潛在實驗偏誤。
受試者在實驗前普遍認為,AI能讓他們加快24%進度,即使在實驗過後,仍普遍認為允許使
用AI可讓實作時間縮短20%。但研究數據卻顯示,實際上允許使用AI反而讓完成時間增加了1
9%。 也就是說,這些軟體工程老手在使用AI工具時,反而變慢了。
用AI可讓實作時間縮短20%。但研究數據卻顯示,實際上允許使用AI反而讓完成時間增加了1
9%。 也就是說,這些軟體工程老手在使用AI工具時,反而變慢了。
根據研究結果,這些老手「被AI拖累」的原因有以下五點:
1. AI工具使用流程增加額外步驟 :開發者在與AI互動、理解AI回應、驗證建議內容時,會
花費額外時間。
2. AI建議需反覆修正 :AI產生的程式碼或建議往往不完全符合專案需求,開發者需多次修
改、整合或重寫。
3. 高品質標準下AI表現有限 :在大型、成熟的開源專案中,對程式碼品質、測試、文件等
要求高,AI生成內容較難一次達標,需人工補足。
4. 隱含需求難以明確傳達給AI :專案中有許多隱性規範或背景知識,AI難以完全掌握,導
致開發者需花時間解釋或修正。
5. 學習與適應成本 :即使開發者已有AI工具經驗,仍需適應新工具或新工作流程,短期內
可能降低效率。
要說明的是,參與者雖有AI經驗,但其實多數僅使用Cursor數十小時經驗而已。 因此可以
說,有經驗老手若還不太熟悉使用AI編程工具如Cursor,在他們熟悉的領域內,其實不用AI
的效率反而更好。
說,有經驗老手若還不太熟悉使用AI編程工具如Cursor,在他們熟悉的領域內,其實不用AI
的效率反而更好。
因此可以說,現在企業普遍認為「導入AI必能提升生產力」的假設,其實有待商榷。
https://i.meee.com.tw/xX1Hjvg.jpg
![[圖]](https://i.meee.com.tw/xX1Hjvg.jpg)
,正是因為自己太有經驗,導致 AI 很難真正幫上忙。
結論:無腦導入AI可能弊大於利
總結來說,這項研究的最大發現是,即使已經是程式開發老手,光是嘗試使用所謂Vibe Cod
ing工具本身就一種全新的技能,這種與AI協作進行軟體開發的實作,相較以往是具顛覆性
的,企業主在導入相關AI工具時仍需考量團隊及專案得適切性,否則很可能只是搞的團隊人
仰馬翻,甚至錯估導入AI的成效,最可怕的是誤殺忠良,讓有能力的工程師被誤會「不懂AI
」。
ing工具本身就一種全新的技能,這種與AI協作進行軟體開發的實作,相較以往是具顛覆性
的,企業主在導入相關AI工具時仍需考量團隊及專案得適切性,否則很可能只是搞的團隊人
仰馬翻,甚至錯估導入AI的成效,最可怕的是誤殺忠良,讓有能力的工程師被誤會「不懂AI
」。
但不要誤會了。這份研究是針對「老手工程師」對於「使用AI工具」的評估,因此無法代表
所有開發者或不同類型專案。同時,研究僅針對開發者在自己熟悉的專案中處理真實議題,
故結果也不適用於新手、跨領域協作或陌生專案等情境。
所有開發者或不同類型專案。同時,研究僅針對開發者在自己熟悉的專案中處理真實議題,
故結果也不適用於新手、跨領域協作或陌生專案等情境。
另外值得注意的是,部分開發者獲知實驗結果後反映,使用AI工具讓開發過程更有趣或更具
互動性,即使未提升效率,仍願意持續嘗試,為未來更強大的AI系統做準備。
看到這邊,還認為AI是效率萬靈藥嗎?如果是,你可能需要好好想想。
心得:
這篇研究蠻有趣的,不知道跟大家體感差多少
我朋友的公司是強力導入AI開發後
宣稱已達到工程師效率提升30%
但他們沒有把產品上市時間縮短30%
是用減少10%工程師跟多做20%事情來達成
具體怎麼算的可能只有高管知道了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.162.50 (臺灣)
※ 作者: xephon 2025-07-16 09:11:00
※ 文章代碼(AID): #1eTlmd1j (Soft_Job)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1752628263.A.06D.html
推 : 或許對於資深工程師來說,寫code比寫prompt 更快吧,1F 07/16 09:15
→ : 尤其這次實驗的是他們熟悉的專案
→ : 尤其這次實驗的是他們熟悉的專案
推 : 多的20%時間差不多就是學習的成本吧3F 07/16 09:29
推 : METR從名字看就不像會客觀研究的4F 07/16 09:45
推 : 有感,工程師會使用AI來進行function的重構,會讓code變得5F 07/16 09:49
→ : 較難閱讀,當在審視PR的時候,需要較多的時間來理解重構
→ : 後的內容是否有達成需求以及範蓋邊界條件
→ : 較難閱讀,當在審視PR的時候,需要較多的時間來理解重構
→ : 後的內容是否有達成需求以及範蓋邊界條件
推 : AI常常想太多 容易出現無效的程式碼8F 07/16 10:20
推 : 以前資深RD只需要講個幾句沒重點的9F 07/16 10:31
→ : 就有初階RD幫你通靈完成需求
→ : 現在你需要鉅細靡遺的對著AI講出需求
→ : 哪個比較快不用比吧?
→ : 就有初階RD幫你通靈完成需求
→ : 現在你需要鉅細靡遺的對著AI講出需求
→ : 哪個比較快不用比吧?
推 : 資深工程師開課介紹各種AI用法的收入應該可以提升30%13F 07/16 11:16
推 : AI就是實習助理工程師,輔助用的而已14F 07/16 11:45
推 : 笑死,s說的通靈真的有感15F 07/16 12:06
→ : 用幾十小時也叫老手16F 07/16 13:07
→ : 我都拿來寫自己也看不懂的註解 讓人以為我棒棒負責17F 07/16 14:43
推 : 簡單講就AI不會通靈XD18F 07/16 16:23
推 : 現在已經一堆資深的開課教AI賺FOMO仔的錢啦19F 07/16 16:24
→ : 不就前幾天oopFoo貼的?20F 07/16 17:09
推 : 這些都是溝通問題啊.....21F 07/16 17:37
推 : 原因,理由都是推測。這個實驗重點是,每個參與人員,做完22F 07/16 17:50
→ : 後,自我評估工作效率是+20%+,但實際是-19%。
推 : 我不會說ai泡沫要破滅,但確實最近有點消風。
→ : 後,自我評估工作效率是+20%+,但實際是-19%。
推 : 我不會說ai泡沫要破滅,但確實最近有點消風。
推 : 開課噱海囉 但免費資源很多啦 而且一直變變變 沒必要25F 07/16 20:20
→ : FOMO
→ : FOMO
推 : 覺得AI能做就跑去摸魚了 實際效率下降十九趴27F 07/16 20:22
推 : 我覺得蠻多持平之聲都很中肯28F 07/16 20:46
→ : 對於自己比較不擅長的領域AI會幫忙很大
→ : 譬如說我不會寫宣傳文 AI可以幫我寫出情緒價值滿滿的文章
→ : 對於我不熟的資訊類其他工作也表現得不錯
→ : 因為我有基礎的知識知道該怎麼跟AI互動會得到最好結果
→ : 但是對於我已經做了十年的工作 短時間很難直接套用AI
→ : 就算改變工作方式套了AI產量變10倍
→ : 這時候碰到非生產的其他瓶頸幾乎是100%
→ : 如果不妥協硬推下去那一定是偷懶或是接案或是離職創業之路
→ : 對於自己比較不擅長的領域AI會幫忙很大
→ : 譬如說我不會寫宣傳文 AI可以幫我寫出情緒價值滿滿的文章
→ : 對於我不熟的資訊類其他工作也表現得不錯
→ : 因為我有基礎的知識知道該怎麼跟AI互動會得到最好結果
→ : 但是對於我已經做了十年的工作 短時間很難直接套用AI
→ : 就算改變工作方式套了AI產量變10倍
→ : 這時候碰到非生產的其他瓶頸幾乎是100%
→ : 如果不妥協硬推下去那一定是偷懶或是接案或是離職創業之路
![[圖]](https://i.imgur.com/ZB1tQ1Lh.png)
推 : AI在"抽象"方面表現不錯,像藝術跟唬爛表現不錯38F 07/17 00:37
→ : 但是要求"精確"的事,如寫程式卻是"抽象"化了
推 : 所以像code review沒意外的話也會蠻唬爛的
→ : 除非本身就用Lint tool輸出的結果然後用LLM講述給你聽
→ : 但那本身就是Lint tool的功勞, 不是AI的功勞
→ : 但是要求"精確"的事,如寫程式卻是"抽象"化了
推 : 所以像code review沒意外的話也會蠻唬爛的
→ : 除非本身就用Lint tool輸出的結果然後用LLM講述給你聽
→ : 但那本身就是Lint tool的功勞, 不是AI的功勞
推 : 有時候多問幾次LLM就開始產生幻覺,一直給我無效的Code43F 07/17 00:54
推 : 這樣老闆應該會火掉這些用AI效率變差的工程師吧?44F 07/17 02:00
推 : 大project需求要講精確太難了45F 07/17 07:32
→ : 最好用就是臨時要寫個script或tool
→ : 最好用就是臨時要寫個script或tool
推 : 幫忙直接撰寫驗證部分其實滿有幫助的,瞬間幫你配置好47F 07/17 10:54
→ : 好,直接複製貼上就行了,其他的,只能說還是容易唬爛
→ : ,需要重複檢查
→ : 好,直接複製貼上就行了,其他的,只能說還是容易唬爛
→ : ,需要重複檢查
推 : 大project需求要講精確太難了+150F 07/17 15:41
--
※ 看板: Soft_Job 文章推薦值: 0 目前人氣: 0 累積人氣: 6
作者 xephon 的最新發文:
- 442F 89推 228噓
- AI變豬隊友?資深軟體工程師用Cursor「工作效率降19%」:背後原因是?導入AI錯了嗎? 2025.07.15 資料來源:METR、路透社 責任編輯:李先泰 內文: 重點一:2025年初AI工具 …46F 22推
- 標題:美國6月份CPI 來源:U.S Bureau of Labor Statistics 網址: 內文: 美國6月 CPI 年率 前值 2.40% 預期 2.70% 公布 2.70% 美國6月 C …204F 137推 8噓
- 美國總統川普4月2日宣布對等關稅政策,引發全球股災,國安基金4月8日宣布進場護盤,台 股逐漸回穩;不過,川普政府近日陸續揭曉各國關稅稅率,但台灣稅率尚未公布,不確定性 仍高。國安基金今天(14日)將 …158F 82推 19噓
- 美國總統川普推動「對等關稅」持續「開獎」,迄今已向22國寄出關稅通知信,但台灣始 終未列入名單。根據外媒報導,川普表示,對尚未公布的貿易夥伴,計劃實施15%至20%的 全面性關稅,亦即台灣最終稅率可 …139F 62推 16噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享