作者 lycppt ()標題 [新聞] 防AI「統派化」 數發部打造台灣主權AI時間 Fri May 9 12:34:20 2025
自由時報
防AI「統派化」 數發部打造台灣主權AI訓練語料庫
2025/05/09 12:07
https://img.ltn.com.tw/Upload/business/page/800/2025/05/09/5037550_1.jpg
數發部長黃彥男今天在台東大學演講,特別說明建構台灣主權AI。(記者黃明堂攝)
〔記者黃明堂/台東報導〕在AI時代,中國擁大量資料,將造成AI運算模式大中國化,特別
是產生政治上偏見;有鑑於此,數位發展部部長黃彥男今天在台東大學演講時提到,數發部
正在打造台灣主權AI訓練語料庫,由機關先行,並鼓勵企業釋出資料,並訂定授權條款,消
弭資料用於AI訓練涉及的智慧財產權疑慮。
黃彥男應台東大學之邀,今天在向師生專題演講時,講述AI產業五大政策工具,特別提到,
台灣的資料量在世界上相當少,AI的大語言模型很容易搜尋到中國的資料,形成中國觀點,
政治上的偏見更是可以想像,所以台灣要有自己的資料模型,把台灣本土資料拿出來,供AI
大語言模型訓練。
黃彥男說,為精進台灣生成式AI對話引擎,數發部已著手請各部會開放出超過5萬筆資料,
包括語文、歷史、地理、動植物及國家文化記憶庫等各個層面,還有業務資料、政策法規等
文本資料逾1600項,已提供國科會打造台灣價值的可信任生成式AI,調整模型來適應台灣的
語言文化及社會價值。
數發部也徵集高品質正體中文語料,採用台灣文化特色與觀點,繁體中文塊狀資料具備語意
連貫性,內容完整且流暢,非僅由數字圖表或修列式文字構成;由於更多的資料是在民間企
業,當務之急也是要訂法法律條款,請企業釋出資料,無償供AI訓練使用。
黃彥男說,打造台灣主權AI訓練語料庫,是由政府機關先行, 持續擴大文本資料開放,偕
同智慧財產局與台灣學者共同研擬「台灣主權AI訓練語料授權條款」及相關使用規範,以消
弭資料用於AI訓練之疑慮。
https://ec.ltn.com.tw/article/breakingnews/5037550
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.70.122.223 (臺灣)
※ 作者: lycppt 2025-05-09 12:34:20
※ 文章代碼(AID): #1e7ONEsk (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1746765262.A.DAE.html
→ fony1029: 笑死人
一定又是大罷免大成功的LLM1F 223.137.46.37 台灣 05/09 12:34
推 z842657913: 連chatDPP都搞不好的廢物3F 101.12.102.31 台灣 05/09 12:35
噓 ShoMing: 又來騙錢了4F 124.6.9.228 台灣 05/09 12:35
→ fony1029: ChatDPP表示5F 223.137.46.37 台灣 05/09 12:35
推 tooeasy: 綠共資料庫6F 1.171.212.116 台灣 05/09 12:35
推 ErosAmour: 你們民間公司還跑去人家小紅書訓練8F 111.83.92.207 台灣 05/09 12:35
→ heavenwind: 又要啥國家隊。騙預算9F 114.137.193.188 台灣 05/09 12:35
噓 max995511: 正事不做10F 111.71.214.176 台灣 05/09 12:35
推 hakuoro: 我們的政府很有錢 創世神快來標案啊11F 42.73.107.149 台灣 05/09 12:35
推 mightshowgun: chatdpp歷歷在目到底誰在獨裁化12F 59.115.36.187 台灣 05/09 12:36
→ fony1029: 民主AI 那一定很會說謊13F 223.137.46.37 台灣 05/09 12:36
噓 mastoid: 不要臉14F 118.231.137.176 台灣 05/09 12:36
→ tooeasy: 先說這又要花幾十億?16F 1.171.212.116 台灣 05/09 12:36
→ fony1029: 應該是採集Threads在做模型17F 223.137.46.37 台灣 05/09 12:36
→ cat5672: 你怎麼可能幹得過簡體資料的總量18F 59.124.23.145 台灣 05/09 12:37
→ a7788783: 拿著這個噱頭又打算要幾百億。了?19F 42.71.212.33 台灣 05/09 12:37
推 scum5566: 只要問綠營人物死了沒,AI直接報警上門20F 36.232.179.152 台灣 05/09 12:37
推 ihero: 注意,你的資料會無償給政府訓練AI?21F 101.10.2.129 台灣 05/09 12:37
→ scum5566: 查水錶22F 36.232.179.152 台灣 05/09 12:37
噓 lastphil: H20明明沒買幾張 怎麼訓練23F 125.228.133.58 台灣 05/09 12:37
推 kenny945: 還不是外包給中國24F 1.170.87.222 台灣 05/09 12:37
→ kimkim9988: 花錢25F 124.218.137.156 台灣 05/09 12:38
→ child1991: ChatDPP打贏復活賽了嗎?26F 49.218.91.170 台灣 05/09 12:38
推 hanktan: 第一定律:為民進黨說謊。27F 42.73.64.237 台灣 05/09 12:38
推 xuane: 民進黨在洗滌人心的工程真是方方面面28F 49.215.153.31 台灣 05/09 12:38
→ johnhmj: 看人家中共都做出ai了 反觀還在談理論?29F 49.216.86.25 台灣 05/09 12:38
推 shivaeye: 不打詐騙在弄這個..30F 36.229.187.86 台灣 05/09 12:38
→ a79111010: 這次程式有藏好嗎 不要又去對面拿模型31F 1.34.206.95 台灣 05/09 12:38
推 darkholy: AI綠共化32F 223.138.1.59 台灣 05/09 12:38
噓 brisyeh: 民進黨思想的AI吧!33F 223.136.80.16 台灣 05/09 12:39
推 WTF1111: 要不要先推出支語字幕翻譯機啊34F 42.79.191.10 台灣 05/09 12:39
→ jaceda: DPP吃屎比較快,隨便喊喊然後錢進口袋35F 134.231.162.123 美國 05/09 12:39
→ darkholy: 大家都知道他們想要用AI把民進黨美化,然後用錯誤的謠言來灌輸AI誤導所有人36F 223.138.1.59 台灣 05/09 12:39
→ mmas: 好啦 要幾億38F 120.101.195.14 台灣 05/09 12:40
推 tanby: 這種比較實際 不要再搞自己訓練模型了 根本浪費錢39F 36.225.81.217 台灣 05/09 12:41
推 volkov: 又要騙預算,好好賺41F 42.79.169.49 台灣 05/09 12:41
噓 paladinwu: 青鳥自high訓練庫吧42F 175.182.172.101 台灣 05/09 12:41
噓 gaiaesque: 錢花在這?43F 61.227.27.167 台灣 05/09 12:42
噓 jupei5566: 幹你娘騙錢東西44F 49.216.255.215 台灣 05/09 12:43
→ saltlake: 鼓勵企業釋出資料 <- 好料的給黨瞧瞧45F 114.36.217.241 台灣 05/09 12:43
推 scum5566: 未看先猜,去跟中共國買模型回來改46F 36.232.179.152 台灣 05/09 12:44
→ holyhelm: 笑死 上次才被抓包拿中國的來改47F 114.27.89.142 台灣 05/09 12:45
推 m3fm03: 又可以出國囉48F 106.64.49.36 台灣 05/09 12:46
推 artyman: 學中國的玩法 加油49F 36.228.102.181 台灣 05/09 12:48
推 mirce: 青鳥是大民主 哥布林是友善的 綠共是讚美50F 111.83.102.7 台灣 05/09 12:48
推 fony1029: 業務費一直請一直爽啊 多少青鳥撿角不能工作51F 223.137.46.37 台灣 05/09 12:49
推 jerry7668: 又要騙多少錢?53F 223.140.103.155 台灣 05/09 12:49
→ ymib: 每次都盜copy中國軟體,繁體化又沒做好
民進黨AI居然還會有簡體字,一個中國54F 114.136.197.93 台灣 05/09 12:51
推 wilson3435: AI也中共同路人??56F 218.35.143.24 台灣 05/09 12:52
推 SShirakawa: AI也需要被思想教育,党真的很會57F 42.72.1.52 台灣 05/09 12:52
→ sheepxo: 又會是綠友友得標啦 然後弄到不知道民國幾年 做出來的東西不堪一擊58F 49.216.187.175 台灣 05/09 12:53
--