看板 Stock作者 Lushen (pttlushen)標題 [新聞] 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版時間 Mon Feb 10 14:21:23 2025
原文標題:
三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型
原文連結:
https://ithome.com.tw/news/167280
發布時間:2025-02-08
記者署名:王宏仁
原文內容:
OpenAI去年發表了新一代推理模型o1之後,讓眾人看到GAI開始媲美真人博士或軟體開發高手般的解題能力,掀起了新一輪的大型語言模型競賽。春節期間,以開放權重釋出的DeepSeek R1模型,大幅降低了這一波推理模型競賽的門檻,成了全球AI產業的熱門焦點,開始浮現客製化推理模型的趨勢。
臺灣也有三位AI專家,在2月7日發起了一項臺灣製造大型語言模型計畫,專案代號「自由鋼普拉」(FreedomGunpla R1),希望募資3千萬元,預計在3月底釋出第一版預覽的推理模型。
這款引起全球AI圈熱議的DeepSeek R1模型,在論文中揭露了多項媲美甚至超越OpenAI o1推理模型的能力,因為可以部署到本地端,來避免企業自己的機敏資料上傳到網路,而引起AI圈的重視,不過,R1模型簡體版用戶協議中提到自己通過三項中國AI法規的備案,也讓外界擔心這款模型生成的內容偏重於對齊中國價值。
因此,臺灣有三位不同AI領域的專家,發起了這項重新改造DeepSeek R1,來打造對齊多元價值的繁體中文版推理模型計畫「自由鋼普拉」。這三位發起人,包括了AI PM助理新創MeetAndy AI創辦人薛良斌,Taiwan LLM開發者林彥廷以及雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌。
薛良斌是台灣生成式AI年會主辦人,也是知名售票平臺KKTIX和MLOps新創InfuseAI的共同創辦人,由他來負責募集這項模型改造計畫的資源。
林彥廷則是具有中文大型語言模型訓練經驗的專家,他剛結束了在Meta的實習,參與了Meta訓練Llama模型的過程。林彥廷將負責FreedomGunpla R1的模型訓練工作。而最後一位郭榮昌則擁有大規模GPU叢集管理經驗,旗下公司曾獲得Nvidia破億元投資,也擁有亞洲最大的GPU農場。郭榮昌將負責算力架構和管理。
臺灣目前也有幾款繁中版大型語言模型,主要以Meta釋出的Llama模型為基礎來客製訓練,但薛良斌認為,Llama 3模型不夠聰明,甚至用以「太笨了」來形容,他指出,如果想要打造出自主能力的AI代理,使用媲美O1等級推理能力的模型是最低標準。
這項計畫的技術重點包括了,將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌。薛良斌強調,這不只是一個技術專案,更是一項文化工程,因為這是一項多元價值觀的對齊任務。
預計分三階段來實現目標,第一階段先對齊西方價值觀,可能導致模型推理能力下滑,薛良斌評估,很高機率達成這個里程碑。第二階段再進一步讓變笨的模型變得聰明,這部分則需要投入更多資源來驗證。這項計畫的終極目標是,不論使用者用繁體中文或是英文時,這款模型的表現可以比使用簡體中文更好。
這項計畫希望募資3千萬元,將由財團法人開放文化基金會(OCF)處理募資,專款專用,透過這筆資金,希望至少可以訓練兩次模型。在時程上,初步預計2025年3月底前釋出第一版預覽模型,開始搜集早期測試者的意見回饋後快速迭代,再釋出最終的版本。
心得/評論:
有料有料
台灣軟體界的大前輩出來號召要用中文資料改進 Deepseek
這樣就對了
比起開源社群那些意識形態掛帥
Deepseek剛出來在那邊喊偷資料、繞過天安門好棒棒
台灣純軟圈大佬出來喊
那些就乖乖閉嘴了XD
可以正視 Deepseek 的實力
借力使力才是真的
開發團隊陣容也相當OK
期待成果
AI PM助理新創MeetAndy AI創辦人薛良斌
Taiwan LLM開發者林彥廷
雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌(由NVIDIA投資)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.57.249 (臺灣)
※ 作者: Lushen 2025-02-10 14:21:23
※ 文章代碼(AID): #1dgPhb7P (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739168485.A.1D9.html
推 h0103661: 沒問題吧,開源本來就是給你自己玩1F 02/10 14:22
原文:
https://reurl.cc/aZjjK4
推 freshman: 怎麼可以依賴中國?!我們要自立自強啊!2F 02/10 14:22
推 fhjqwefs: 抄台灣凸面的對岸政府是不是都是台獨同路人 白O
圖面7F 02/10 14:24
推 Lhmstu: 完了要被吊路燈了13F 02/10 14:25
推 uller: 募資白嫖 台灣人真好騙14F 02/10 14:25
推 glen: 青鳥怎麼不快出征啊 用對岸的東西還敢募資(咦?)15F 02/10 14:25
推 y800122155: 所以就是用簡中會變笨的模型嘛 防偷神器XDDD16F 02/10 14:26
噓 raymonde: 難怪賴皇300億預算可以搞ai 原來是要當中共同路人19F 02/10 14:26
噓 beariscut: 這三位有脆鳥跟點麵線部長懂AI嗎?21F 02/10 14:26
→ DAEVA: 數發部震怒23F 02/10 14:27
→ CCH2022: 台灣真的要加緊腳步了。AI基礎建設硬體供應鍊在台灣已經是很大的優勢,軟體方面則尚未成火候,硬體25F 02/10 14:27
→ CCH2022: 主要是企業自己拼的。政府要多重視軟體這一塊。28F 02/10 14:27
噓 knives: 不就拿人家開源下去改,然後說是原創的,要花幾百E29F 02/10 14:27
→ josephpu: 管他中國還北韓做的,能用最大,傻了才在政治腦31F 02/10 14:27
推 fhjqwefs: 本來就是 白癡到極點 股票多好賺還要當工讀生34F 02/10 14:28
推 ssarc: 又要花錢做垃圾了35F 02/10 14:28
推 yuchifan: 發展Deepfake 嗎?39F 02/10 14:29
※ 編輯: Lushen (36.229.57.249 臺灣), 02/10/2025 14:30:40
推 sonyvaio: 會不會會第二版叫正義鋼普拉 這三個都SEED 迷嗎?=.=42F 02/10 14:31
推 jery1017: 軟硬體,中共國早就超越台灣了45F 02/10 14:31
推 sola01078272: 快抄吧 在不抄連搶椅子上桌的資格都沒有 不要被那群垃圾的意識形態綁住47F 02/10 14:32
→ x58420: 一起抄起來49F 02/10 14:32
→ TaiwanUp: 去麥當勞找老人募資應該可以50F 02/10 14:32
推 ice520: 抓到了 中共同路人55F 02/10 14:33
推 suzer: 拿開源去改的專家56F 02/10 14:33
→ tompi: 左岸的來改好意思?57F 02/10 14:33
→ shinewind: 做成功了放在自己的計畫上
失敗了反正也不是花自己的錢??58F 02/10 14:33
推 pansquarl: 加油,希望真的弄出來,不然會被鄉民笑的喔60F 02/10 14:34
推 Lowpapa: 不會自己出錢還在那邊圈錢....62F 02/10 14:34
→ Lowpapa: 自己要做實驗還要到市場圈錢 真的笑死64F 02/10 14:34
推 ll6a: 重新定義抄襲66F 02/10 14:35
推 gbman: 沒有台灣價值!全面抵制CC68F 02/10 14:36
推 skullno2: 人家是星際之門 我們是門都沒有69F 02/10 14:36
推 pttsac: 抄作業前 你要先看懂作業內容阿.................70F 02/10 14:37
→ gbman: 有本事就改出來賣!還募股是殺小XD72F 02/10 14:37
推 starport: 又在抄 然後換個皮就變成民主AI 太舒服了73F 02/10 14:38
推 axsd: 先罵完再拿來募資 自助餐好吃75F 02/10 14:38
推 ots625: Dotline NOODLES SYSTEM?76F 02/10 14:38
→ ImHoluCan: 還不快基處健設,多買ㄧ點自己的GPU78F 02/10 14:40
→ hydra7: 大佛普拉絲81F 02/10 14:41
推 sonyvaio: 種命 FREEDOM vs JUSTICE?83F 02/10 14:41
→ Bashar: 改造 (致敬86F 02/10 14:42
→ Ceferino: 怎麼不去用llama呢,嘻嘻88F 02/10 14:42
→ dferww55: 這個感覺沒什麼用,等你募資好弄好,人家又換代了,誰還用你的舊東西92F 02/10 14:44
推 c928: 直接複製來用喔?可悲95F 02/10 14:45
→ dslite: 為什麼要這麼多錢啊?李飛飛50鎂耶?97F 02/10 14:45
推 oyaji5566: Gunpla?你取名字前有先問過萬代嗎98F 02/10 14:45
推 TaiwanUp: 這個年頭還有誰不是AI專家的嗎99F 02/10 14:45
推 wed1979: 我怕,台灣只會大外宣,拿錢不辦事的募資平台專案多了是,勿忘台版黑鯊5215F 02/10 17:53
--