看板 C_Chat作者 astrayzip標題 Re: [閒聊] DeepSeek是不是真的很強?時間 Sat Feb 1 20:08:19 2025
說回來
感覺很多人很氣訓練用別人資源
但是感覺又對openAI沒反應
我覺得這就很奇怪
因為OpenAI最知名的一個點
就是因為盜用別人資料訓練所以官司纏身
這幾年可非常多新聞
但很妙的似乎有人看到DeepSeek才開始氣到中風
這種現象真的很神奇
真的要氣 打從前幾年就要一直罵OpenAI了吧?
甚至整個生成式AI都要全罵了
因為根本沒有幾家是拿到全部授權才訓練的
幾乎每家的產品都踩到「未經授權」這個大問題了
要生氣 應該打從這波AI浪潮一開始
就一路氣瘋到現在了 中風幾十次了吧
怎麼是看到DeepSeek才突然暴跳如雷?
--
提個ACG點
鋼彈Seed裡面最後誰都在用鋼彈臉
很多根本沒得到聯邦團隊授權
但最後還是滿地的鋼彈跑
最後最強的幾台大多都是札夫特設計的
然後歐普再拿去魔改
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.0.64 (臺灣)
※ 作者: astrayzip 2025-02-01 20:08:19
※ 文章代碼(AID): #1ddWwrKr (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1738411701.A.535.html
※ 同主題文章:
Re: [閒聊] DeepSeek是不是真的很強?
02-01 20:08 astrayzip
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:09:20
推 x2159679: 現在ai界都覺得用網路上的資料沒關係
用別人訓練的東西才有關係2F 02/01 20:09
推 tank44444: 異端用基拉的戰鬥資料有經過授權嗎? 應該有4F 02/01 20:10
→ astinky: 繪師早就戰爛了哪有沒戰9F 02/01 20:11
推 x2159679: 這就是繪師一直在戰的東西啊10F 02/01 20:11
但氣到中風的繪師不會突然跳出幫OpenAI唉吧XD
應該是全部一起罵
畢竟OpenAI自己也是盜圖訓練的大咖啊XD
→ RandyOrlando: 像我自己有買chatgpt 身邊朋友還是工程師的 說要付費他就不用了11F 02/01 20:11
→ Justisaac: 最大的問題仍然是AI訓練到底有沒有侵犯著作權XD13F 02/01 20:12
→ x2159679: 自己生的圖不能拿去訓練
OPENAI同理19F 02/01 20:13
→ RandyOrlando: 畫師根本防範不了啊 現在連歌手的聲音都有辦法用 AI重現了21F 02/01 20:13
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:13:55
→ x2159679: 其實說難聽點就是因為難以維權直接變成被剝削階層26F 02/01 20:14
→ Justisaac: 不是防範與否的問題,是告了也很可能不會贏。27F 02/01 20:14
→ x2159679: 然後ai咒術師都會覺得自己才是剝削別人的那一方30F 02/01 20:14
→ ZMTL: 我覺得OpenAI用版權物訓練模型合法、DS用GPT生成內容訓練也31F 02/01 20:14
→ ZMTL: 合法啊,但雙標的人我就不懂了33F 02/01 20:15
→ Justisaac: 更別提畫風或是聲音特徵本來就不被保護34F 02/01 20:15
推 yezero: OpenAI感覺只是想打商業戰而已,用專利侵權去卡別人的腳是基本招。是不是真的能告侵權成功並不重要,是要妨礙對手而已。35F 02/01 20:15
→ Justisaac: DS用GPT生成內容訓練要看有沒有違反使用者合約就是
也許可以告38F 02/01 20:16
→ tank44444: 一些MOD甚至用AI模仿知名配音員的聲音40F 02/01 20:16
推 arrenwu: 提起訴訟肯定是可以啦 畢竟那是公民的權利41F 02/01 20:17
→ Justisaac: AI模仿太簡單了啦 名人影片訓練一下就有了43F 02/01 20:17
→ ZMTL: 違反使用者合約當然違反,但違不違法可不是合約說了算44F 02/01 20:17
→ Justisaac: 訓練聲音模型甚至不需要啥成本,用免費算力就夠了45F 02/01 20:18
→ ZMTL: 我記得都有電玩廠商禁止玩家賣二手實體片了46F 02/01 20:18
→ astinky: 如果這社會對未來的想像就是賽博龐克那樣,openAI那麼大的商業利益,感覺買兇殺人還比法律戰來得有可能47F 02/01 20:18
→ arrenwu: 民間契約 但法令要不要保護你就是另外一回事49F 02/01 20:18
→ Justisaac: 開源模型而且公開算法,你要殺誰啦XD51F 02/01 20:19
→ x2159679: 現在OPENAI要開始派人暗殺ds製作方了吧52F 02/01 20:19
推 kaj1983: 也要有法可以讓你違吧,目前AI的法律有訂定出來了嗎?53F 02/01 20:19
推 Armour13: 看圖卡跟kol站隊的低認知族群的想法不用試圖去理解54F 02/01 20:19
→ Justisaac: 最主要是約定契約但沒有約定賠償XD55F 02/01 20:19
→ arrenwu: 著作權類型的法令當然也可以去加啦56F 02/01 20:20
推 sustto: 資安考量 滿多公司工作不給用ai滴 以後就各家公司開發自家ai 不然就跟大ai公司簽保密合約惹57F 02/01 20:20
→ arrenwu: 只是著作權法令要怎麼幫這個案例? DS做了什麼樣的事情59F 02/01 20:20
→ arrenwu: 會妨礙創意的發展?61F 02/01 20:20
→ R620SCANIA: 8964占占占 deepseek快抓網路文章訓練喔62F 02/01 20:20
→ arrenwu: 這跟專利肯定沒有關係啦 至少我看不太出OpenAI有什麼專利63F 02/01 20:21
→ Justisaac: 比較可能就跟現在的windows商法一樣,一般民眾亂用AI64F 02/01 20:21
→ arrenwu: 被DS侵犯了 總不會LLM變成OpenAI的專利吧65F 02/01 20:21
→ Justisaac: 但商業機構還是要買微軟或是open ai的安全版本66F 02/01 20:21
推 realmd: 中國發明=抄襲偷竊 美國發明=知識共享 懂的都懂67F 02/01 20:21
推 tank44444: chatgpt剛出來時,三星有員工把公司資料丟上去問68F 02/01 20:21
推 afking: 蒸餾技術是用別人的模型當老師,Open AI有規範,跟非法拿資料概念不同69F 02/01 20:22
推 guogu: 資安考量主要是線上版問的東西都會被後面的公司看到
如果用本地模型應該是不會怎樣 只是目前本地版
要到線上版的程度對一般中小企業來說成本又太高71F 02/01 20:23
推 marktak: 歐布才是先趨吧 想拐人啊74F 02/01 20:23
推 x2159679: 那個規範有比繪師在自己的圖上貼禁止ai學習浮水印厲害嗎75F 02/01 20:23
推 TheDonDon: 網路上一堆訓練集 為啥不能用==?76F 02/01 20:23
→ Justisaac: 使用者規範通常只能在違反的時候停權帳號啦XD
畢竟AI生成物很多地方沒有著作權,後續也沒法求償77F 02/01 20:24
→ afking: 簡單來說一個是偷書賊,一個是盜錄教學影片
只是偷書的話成本是降不下來的79F 02/01 20:25
→ gundam01: 違反使用者規範就停權跟法律懲罰還有點差距81F 02/01 20:26
推 arrenwu: 他有這使用者規範的話,他如果刪除你的帳號,我覺得消保82F 02/01 20:26
推 jahnny: 鋼彈臉應該是聯邦和歐普都有版權吧 只有扎夫特才有 不過84F 02/01 20:26
推 qazzqaz: DeepSeek平台的審查我記得是另外接的?85F 02/01 20:27
→ qazzqaz: 他原始model對占占占的梗搞不好比你還熟,那還需要污染87F 02/01 20:27
推 sustto: 現在就等開盤大媽發紅包 撿便宜233088F 02/01 20:27
→ kuninaka: 違反OpenAI的政策只能BAN帳號89F 02/01 20:27
→ jahnny: 扎夫特一開始就是搶來的 沒在管版權 XD91F 02/01 20:27
→ icq150220: 因為歐噴Ai是美國的,美國爸爸不會錯92F 02/01 20:27
→ afking: 資安這點的話反而是開源模型優勢93F 02/01 20:28
→ TheDonDon: 一堆訓練包裡面都有gpt 的對話集 這也就是為什麼一堆模型你問他是誰 他會直接跟你說他是chat gpt 的關係 然後openai 這一大部分都不抓 跑去抓威脅到他的 嗯…94F 02/01 20:28
→ arrenwu: DeepSeek 會審查啥嗎?97F 02/01 20:28
→ TheDonDon: 審查模型都是一個模組塊 停用那個就好啦98F 02/01 20:28
推 kuninaka: OpenAI今天推出o3-mini,然後通過一堆安全性檢查99F 02/01 20:29
噓 mhwsadb45: 加工過後價值提高後歸加工人 跟另外一個直接沒授權偷100F 02/01 20:29
沒授權直接偷是這波AI浪潮全部都有的問題啊?
沒有任何一家是訓練資料有全部取得授權的欸
→ afking: 因為蒸餾實際也很難抓,除非你自首101F 02/01 20:29
→ kuninaka: 紅區測試
然後這也只是自稱的,因為他沒有open source
DeepSeek-R1就丟在GitHub,大家都能看102F 02/01 20:29
推 arrenwu: 言論審查的是模型資料的一部份吧?106F 02/01 20:30
※ 編輯: astrayzip (39.15.0.64 臺灣), 02/01/2025 20:30:33
→ ghostxx: 中國製造就是DS最大原罪107F 02/01 20:31
推 kuninaka: 網路爬蟲就完全沒經過人家同意阿XD108F 02/01 20:31
→ ZMTL: 沒有,言論審查是模組快,離線模型沒有言論審查的109F 02/01 20:31
→ kuninaka: 難不成說你沒放robot.txt就是可以讓我偷110F 02/01 20:31
→ icq150220: 其實Ai的發展跟權益問題世界各國政府早就開會討論的如火如荼了111F 02/01 20:31
→ kuninaka: OpenAI當初會創立的原因之一就是避免濫用113F 02/01 20:32
→ ZMTL: 所以才有教你怎麼讓DS回答8964... 本機跑就可以114F 02/01 20:32
→ gundam01: 因為大家資料都是網路上沒授權就拿來餵AI115F 02/01 20:32
推 qazzqaz: DeepSeek官方的試用平台存在政治審查,但是可以完全關掉我以為是另外串一個審查,但可能是像TheDon大說的那樣(?116F 02/01 20:32
推 attacksoil: 模型是可以內建censorship的 但可以被破解 這次120F 02/01 20:34
→ ZMTL: 有種可能是他的學習資料是有刻意刪除習近平啦... 這幾B的啊121F 02/01 20:34
→ attacksoil: deepseek的模型有沒有被破解要看一下hugginface122F 02/01 20:34
→ arrenwu: 那個是 R1 14B 的
我很確定他認得習近平 而且我如果攻擊習近平,這個LLM會跟我說討論國家領導人要心存敬意123F 02/01 20:34
→ ZMTL: 看一下能不能改它的system prompt126F 02/01 20:36
推 arrenwu: 這幾個問題我去問Phi都可以取得很正常的回答127F 02/01 20:37
推 icq150220: 怎麼現在還在討論DS禁言問題啊==128F 02/01 20:38
推 arrenwu: 其實問題不是禁言,而是這反應出DS有一些語言判定上的
先天缺點
但很專業的用途應該是不太會受到影響129F 02/01 20:39
推 attacksoil: 順便提一下 14B的其實不太算是deepseek v3/r1模型132F 02/01 20:40
→ qazzqaz: 因為有推文拿來嘴,話題就變成討論技術了w133F 02/01 20:40
→ attacksoil: 那幾個小模型 是蒸餾的llama/qwen模型134F 02/01 20:41
推 square: 不是一堆人退X了135F 02/01 20:41
→ afking: 就算如此還是能Finetune這些問題吧,只是要另外花時間136F 02/01 20:41
推 arrenwu: 喔喔 了解了 這個我之前倒是沒有注意到137F 02/01 20:42
→ afking: 而且如果DS成本是真的這麼低,應該很快有其它模型跟上138F 02/01 20:42
→ ZMTL: 唐鳳在Threads上表示,在本機離線的情況下,使用運行大型語言模型的平台LM Studio操作DeepSeek,「只要用 U先輸入思考過程和回答的前綴,再用→繼續生成回答」,就可以繞過言論審查。
看起來有用Prompt控制輸出結果了,但就可以讓它無效139F 02/01 20:43
推 arrenwu: 那個做法是「破解DS不能批評習大大」的過程
但我希望LLM本身不要有認知偏差144F 02/01 20:44
推 Ceferino: 記得sam在該的時候好像是美國出版協會直接在推文下酸他有什麼資格該146F 02/01 20:45
→ arrenwu: 我倒不是太在意他不能在一個對談中迴避習近平問題148F 02/01 20:45
推 guogu: 我覺得比較可惜的是調用api沒想像中的便宜
雖然是很便宜了 在openrouter上完整r1大概是4o的1/6
但我原本以為能幹到跟4o mini差不多價
然後看到b站有人在問能不能讓他不要"想"
他一堆錢都被他給"想"掉了w149F 02/01 20:45
推 a28200266: 因為台灣其實不怎麼懂AI 只懂AI可以讓台積電乃至於台廠賺大錢 股價upup 現在誰干擾到股價就是敵人 懂嗎154F 02/01 20:45
推 art1: 沒錯,看到會一直在那邊想才能有近似的答案,不用想直接輸出真的好用多了 XD157F 02/01 20:56
推 guogu: 其實我覺得有好的開源模型gg應該要漲才對啊
這應該會讓更多企業有本地AI的需求讓晶片需求提升159F 02/01 20:56
推 SYMS: 只要是中國,吃別人拉的屎,也會氣死,這就是台灣163F 02/01 21:01
推 capser: DS aka 想想164F 02/01 21:07
推 Hosimati: 覺得別人沒反應是幻覺吧
從openai 還有那堆生成式產圖ai,都有訓練資料來源未授權的問題,只是發展到現在如果要把這些東西一刀切,那你可能要問還有多少蒸汽機沒砸到165F 02/01 21:07
→ j5a5m0e4s: 可悲啊 政治立場決定台灣人怎麼看科技172F 02/01 21:20
推 yzhna: 很簡單阿,美國可以 他國不行阿
就自卑心作祟,恨不見別人好174F 02/01 21:23
推 Snomuku: 又用AI又想站在道德制高點 不要臉= =176F 02/01 21:35
--