看板 C_Chat作者 Mayfly (Baccano)標題 [閒聊] 最近deep seek評價變差了?時間 Sun Jun 22 19:39:50 2025
如題
最近看對岸一些寫文的、撰稿的、跑團的
好像不少人在抱怨deep seek的問題?
大致上就是
幻覺太嚴重
(自己腦補出錯誤的訊息,比如不存在的參考書或角色
容易偏移
(角色個性突變,自己冒出新人設或背景劇情
記憶被拒絕
(簡單來說就是個人想要植入一些設定或是信息要AI記憶會很容易被拒絕
原因不外乎中國老問題了
幻覺:作為主要大數據來源的中國網路文化太過抽象,無數的代稱和暱稱讓溝通小圈圈變得
極為困難
偏移、記憶:有許多資料的採信度被設定的非常高,比如說與官方媒體信息違背的時候就容
易被否定
此外雖然deep seek打響了低價AI使用的第一彈,但在gemini和grok之類的後來者面前已經
沒啥優勢了
而且他們更適合創作(咳咳,簡單來說就是更自由
所以最近deep seek的使用者評價貌似有所跌落……
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.66.27 (臺灣)
※ 作者: Mayfly 2025-06-22 19:39:50
※ 文章代碼(AID): #1eL-k8CS (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1750592392.A.31C.html
→ Owada: 我有發現
不知道為什麼從某一天之後deepseek翻譯的品質變得非常差2F 06/22 19:41
推 AndyMAX: 不意外 看柵欄就知道牆內平行宇宙4F 06/22 19:42
→ Owada: 現在感覺和chatgpt差不多了5F 06/22 19:42
→ as3366700: deepseek後來有更新過嗎 其他家都不知道迭代幾次了每個6F 06/22 19:42
→ sheo99: 剛出的時候一堆板在那吹上天7F 06/22 19:43
→ as3366700: 都有自己的優勢 我現在都用gemini產文 GPT產圖 gork3查8F 06/22 19:43
推 guogu: 最近R1有更新過小版本 思考變得非常長 很花時間...11F 06/22 19:44
→ h0103661: 有沒有更新、多少人在用google就有12F 06/22 19:44
→ guogu: 不過deepseek的重點本來就不是強弱 是開源加上低成本13F 06/22 19:45
推 as3366700: 想了一下ds的優勢大概思考過程很好笑14F 06/22 19:45
推 emptie: 這個的優勢不是你可以放在本機跑嗎(若你的硬體允許)15F 06/22 19:46
→ emptie: 要跟別的線上服務比打不過正常18F 06/22 19:46
→ Mayfly: 不過他還是有把AI價格壓低的良好歷史定位19F 06/22 19:46
推 chejps3105: deepseek最大的貢獻就是讓其他家生成式AI降價20F 06/22 19:48
推 twic: 是不是吸太多毒21F 06/22 19:49
推 RbJ: 演算方式的改良進而降低成本,但也只是這樣,要繼續推進AI還是要有GPU,所以過年那時候吹多高,現在就跌多少25F 06/22 19:57
→ bluejark: 他的網站本來就沒人吹啊要自由就要自架與修改27F 06/22 19:57
推 kimokimocom: 你不能罵DS 等等開源黨就要來教你小常識了
他表現再差都不是重點 重點是...28F 06/22 19:58
→ Srwx: 優點幾乎沒了 而且那些缺點在對岸政策下不太可能改30F 06/22 19:59
→ k5545332: 1、2跟中國沒關係啊,那就是目前ai的瓶頸,換成chatgpt、gemini 也會32F 06/22 20:03
→ MIshad: 幻覺不就一堆人餵垃圾的歷史共業34F 06/22 20:03
推 WiLLSTW: 我有認識中國人在AI公司(不是deepseek)工作的 他說他們工作80%都在把AI弄的「更符合國情」 20%則是要串商業部分(廣告)進去35F 06/22 20:03
推 Nitricacid: 1百分之百是中國問題,沒生成式AI之前看搜尋到簡中文章也是直接蛋雕38F 06/22 20:04
→ WiLLSTW: 從Chatgpt蒸餾的東西其實很容易就辱華40F 06/22 20:05
→ Srwx: 1.2可以連網請求來源 對岸封網路的怎麼可能讓你用41F 06/22 20:05
推 owo0204: 每個都有幻覺
也不只ds42F 06/22 20:05
→ htps0763: 1.2根本就跟ds沒關係,這些大模型都一樣啦44F 06/22 20:05
推 guogu: 都有沒錯 但是當時ds出來時它是主流最嚴重的45F 06/22 20:06
→ htps0763: 說是評價變差根本就是抱怨的人原本沒用過,然後一開始莫46F 06/22 20:06
→ Srwx: 其他思考型AI你要求網址來源通常都會給你能連接的47F 06/22 20:06
→ htps0763: 明覺得AI很屌很好用,結果後來用多了發現沒這麼好就開始48F 06/22 20:06
→ guogu: 不過chatgpt新的版本號稱推理能力變強 幻覺率也是上升了49F 06/22 20:07
→ owo0204: 但我覺得中國人很愛用ds超怪的,又沒特別強,他們一堆人超愛用50F 06/22 20:07
→ htps0763: 抱怨,chatgpt當初在中國以外地區紅也是這樣的歷程52F 06/22 20:07
→ k5545332: 我是建議你可以都去用用看再來發文53F 06/22 20:07
→ owo0204: 為什麼不用gpt 哈基米 gork54F 06/22 20:07
→ guogu: 沒有吧 我現在看B站感覺推gemini pro的更多55F 06/22 20:07
推 WiLLSTW: 推理推到出幻覺其實挺正常吧 沒有來源仍然要掰給使用者看56F 06/22 20:08
→ owo0204: 專業玩酒館啥的都推哈基米,我說一般人58F 06/22 20:08
→ htps0763: 要說的話當初各家都沒有聯網功能,隨便問點東西都滿滿的幻覺59F 06/22 20:09
→ owo0204: 最容易出幻覺的是你問動漫劇情,他會自己亂拼接一通給你61F 06/22 20:09
→ htps0763: 中國人前段時間那個ds熱潮就是之前少數人才能用chatgpt62F 06/22 20:09
推 RbJ: 想到叉雞突然被AI創造一堆不存在的資料63F 06/22 20:09
推 Gjerry: 至少讓各種服務便便宜64F 06/22 20:10
推 Srwx: 當初只能從資料庫亂撈沒錯 現在主流都能連網 DS敢連維基嗎?65F 06/22 20:10
→ htps0763: 然後一堆中國人的第一款AI是ds不是chatgpt,所以才一堆66F 06/22 20:10
推 holiybo: 這就早期的GPT症狀啊 但問題是人家已經改善了67F 06/22 20:10
→ spfy: 現在AI的更新都以月為單位 隔半年就落後很多了 r1有過小版本68F 06/22 20:10
→ htps0763: 開吹,其實就跟全世界第一次流行chatgpt時差不多69F 06/22 20:10
→ spfy: 更新模型也有放出來 光這點就很難嘴了 不爽自己架...
但當初很多人真的把ds吹得太誇張了70F 06/22 20:11
→ owo0204: 當初ds出的時候,一堆中國人那反應跟沒見過ai一樣 明明gpt都出來多久了72F 06/22 20:11
推 WiLLSTW: Deepseek國際間震撼到是被封鎖還能出一個還ok的平替 中國人就幻覺腳踩美國了74F 06/22 20:12
→ Mayfly: 幻覺是都有,但是deep seek的最近很嚴重,常看到有NGA或B站上的人在抱怨76F 06/22 20:12
→ Srwx: 中國自己的資料庫就一堆奇幻內容了 假設DS又是去學那些...78F 06/22 20:13
→ htps0763: 因為原因就是chatgpt根本沒在中國紅過,記得並不像台灣人隨便註冊隨便用,要翻牆還是說有封鎖過忘了79F 06/22 20:13
→ RbJ: 當初就是要吹低配晶片也能造出高規格產品,晶片封鎖無效,所以過年那時候ds被吹到很離譜的高度
那時候一堆便宜的輝達可以撿83F 06/22 20:14
→ vitalis: 對岸之前就有討論,主要是聯網後因為搜尋引擎問題一堆反而更智障86F 06/22 20:15
推 WiLLSTW: 然後聽我朋友說 他們上層不知道是政府壓力還是相信了華為的唬爛 所以不搞N卡跑去買華為的晶片 結果就是那些機櫃根本負資產88F 06/22 20:15
→ AATM1999: GPT早就在亂掰了 其他家跟著唬爛也正常91F 06/22 20:16
推 a0079527: 從很早開始就有問題了 第一個是晶片 第二個是他們用其他AI的資料去過篩 然後人家把它防住之後資料準確就被砍辦了94F 06/22 20:16
→ spfy: 華為就國家機器 麒麟晶片手機板有幾個ID吹到可以出太陽系了99F 06/22 20:18
→ spfy: 看推文我以為台積電上個月被中芯超車 蘋果M系列被麒麟屌放102F 06/22 20:18
→ Xpwa563704ju: 不知道華為那種破芯片台灣到底哪些人在吹的
效能就擺在那還能吹爆103F 06/22 20:19
→ owo0204: deepseek還是功在千秋,而且他預設的語氣比較有趣 雖然g點也很多105F 06/22 20:19
推 ruby080808: 就大家都在吹的風頭過了,真實評價就出來了==107F 06/22 20:21
推 Fate1095: 剛用的時候比chatgpt強,但沒過多久就劣化108F 06/22 20:22
推 WiLLSTW: 有人吹我不意外 但我那個朋友是中國的上市公司 也能被唬才神奇109F 06/22 20:22
→ Fate1095: 尤其最基本的逐字稿翻譯都譯不好,超糞111F 06/22 20:22
推 sss870192: 只想蒸餾薛人 不給蒸餾就拉不起來了 ==112F 06/22 20:23
→ CCNK: 我還不如去用Gimme113F 06/22 20:23
推 tsai1453: 想想那時候那公司的老闆跟員工通通被吹了一遍,不勝唏噓。 既然號稱節能,不如就裝在上海的垃圾桶裡好了114F 06/22 20:26
推 ilove640: 畢竟是平價的 被新的超車也很正常吧 現在迭代速度那麼快116F 06/22 20:26
推 AdventurerCC: DS的資料庫只會讓他終究只能侷限在某種程度,訓練資料本身不僅要面臨各種審查,甚至可能在某一天直接刪除消失119F 06/22 20:29
推 Bugquan: 微軟:我也成了中國人?怎麼覺得吹的就是中國人122F 06/22 20:30
推 howtotell: 便宜不好用很正常,他厲害的是便宜不是好用啊123F 06/22 20:31
→ mapulcatt: 它讓AI整體都變便宜了 還有什麼好酸的124F 06/22 20:32
→ Bugquan: 還讓一堆解除了一些限制125F 06/22 20:33
→ mapulcatt: 難道整個業界都被一個爛貨嚇到改變經營方針嗎127F 06/22 20:37
推 Ipluck: 我也體感DS剛出來比較好用 現在不知道資料被污染還是有調過
不過他光是讓其他ai嚇到開放一堆模型跟功能就沒啥好酸的了 DS還沒出來前gpt一堆模型跟功能都鎖住不給用 付費還有限制真的爛128F 06/22 20:41
推 jaylin1031: deepseek就是小米的感覺,不過第一點GPT也常發生133F 06/22 20:43
→ linzero: 偏移跟記憶,感覺是為避免疊太多設定而被繞過限制吧
幻覺也應該不是資料來源,有不少案例是幻覺出整套都假的134F 06/22 20:47
→ jackz: gemini 真的不錯用136F 06/22 20:48
→ linzero: 參考來源。聽說是DS本身就是偏向完善語言本身,大概就是137F 06/22 20:49
→ linzero: 語意跟語句完整性較強,但從資料獲取事實的邏輯性較差
所以單看表面聊天的話很強,要整理專業性資料問題很大140F 06/22 20:50
推 amsmsk: 跟grok問題差不多吧 資料還不夠多142F 06/22 20:52
→ amsmsk: 現在又被黨的大手給144F 06/22 20:54
→ inte629l: 只記得之前好像有復現論文計畫 現在meta不曉得如何了146F 06/22 21:08
→ inte629l: 離不開gemini 2.5 pro和grok了XD148F 06/22 21:09
推 RandyOrlando: 以前AI翻個五段外文就跟你說今日額度已滿請買付費版
現在翻譯不用錢就是很大貢獻了XD149F 06/22 21:12
推 jay920314: 開R1還啥那個就知道 小劇場太多有時候不太好152F 06/22 21:19
推 usoko: 馬斯克都覺得Grok太多錯誤資料要重新訓練了153F 06/22 21:33
→ Mayfly: 寫文和跑團的不算嗎?還有角色出戲的問題(165F 06/22 22:45
--