作者 sxy67230 (charlesgg)
標題 Re: [閒聊] 各位覺得AI是否無法自創畫風?
時間 Thu Apr  3 09:02:22 2025


※ 引述 《sxy67230》 之銘言:
: 噓 leo125160909: 目前雜訊生成的方式只能生出跟訓練資料相似的東西,  04/02 16:18
: → leo125160909: 無法無中生有                                      04/02 16:18
: → leo125160909: AI畫手指畫成一朵花、畫拉麵用手抓,說明AI生圖跟人  04/02 16:21
: → leo125160909: 類畫圖的邏輯根本上不同,除非AGI能結合邏輯思考生   04/02 16:21
: → leo125160909: 圖,不然目前的AI仍然只是精巧的模仿而已            04/02 16:21

這邊早上才看到,所以想說用回覆的。

這邊說的是diffusion based的model,但這次OpenAI展示的其實可能不是基於這種diffusio
n based model,這邊要說到一個問題就是傳統diffusion model有一個問題就是要做到scal
ing up非常不容易,模型越大越不好做擴散過程(效率慢計算資源消耗大),這導致diffus
ion model通常大小不會太大。雖然說目前確實證實了LDM確實存在縮放法則但真的做到跟LL
M相同尺寸的根本還不存在。


然後這邊要說的是去年字節跳動跟北大的一篇新研究Vision autoregressive model(雖然
作者後來被字節跳動告了,主要原因是因為他不滿公司資源調派,Hacking公司同事的機器
破壞同事的工作。本來字節是惜才不想鬧大後來作者自己鬧大被字節提告),這篇有拿到Ne
uraIPS 2024的最佳論文獎,主要的想法是直接拿現在LLM的自回歸架構來訓練圖片生成,然
後採用了多尺度逐Token預測避免了之前Vision AR模型做不太起來的問題,這樣就把很多計
算問題解掉可以像大語言模型一樣Scaling擴大到70B的參數以上,研究也發現超過現有主流
擴散模型,而且也發現像傳統LDM出現的繪圖細節瑕疵在VAR上是可以大機率被避免掉的。


而且VAR真正開啟的可能是我們可以像LLM一樣訓練VAR對齊人類偏好跟做圖片推理鏈,這應
該是未來3-5年很有可能發生的。
可能未來繪師口中的靈魂跟繪畫溫度只存在提示詞中。

以上

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.105.9 (臺灣)
※ 作者: sxy67230 2025-04-03 09:02:22
※ 文章代碼(AID): #1dxTuWvn (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1743642144.A.E71.html
※ 同主題文章:
Re: [閒聊] 各位覺得AI是否無法自創畫風?
04-03 09:02 sxy67230
Xavy: 求這篇翻譯   我看起來像聽君一席話1F 04/03 09:04
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:05
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:40
melzard: 翻譯過來就是未來能做到自創 或者說讓你看起來像是自創2F 04/03 09:06
error405: 新技術越大張細節越準確的意思嗎3F 04/03 09:06
melzard: 我甚至不懷疑有AI公司將來會策劃用純AI去假冒真人繪師去接案 日常畫圖 最終公布真實身份4F 04/03 09:07
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:08:27
dlam002: http://i.imgur.com/a0FrcaN.jpg Can you?6F 04/03 09:09
[圖]
melzard: 等到了那一天 再也沒人會在乎推特上誰是真人誰是AI7F 04/03 09:11
Innofance: AI可以空手套白狼的特性,中國、日本主流的繪圖接案網站都是明令禁止AI就是8F 04/03 09:14
melzard: 那對Ai公司反而無所謂甚至更好 因為等於利用這些網站來背書他們的AI多強 能騙過這些禁止AI的網站10F 04/03 09:16
Innofance: 目前為止AI還是一看圖層就破功的程度
好個雞八,純詐騙而已12F 04/03 09:16
melzard: 因為AI公司的主要客戶肯定不會是這些接案網站  成功創造出擬人AI商機也遠大於和這些網站訴訟的小錢14F 04/03 09:18
pikachu2421: 日本沒有都禁啊 skeb有禁AI pixiv沒有禁16F 04/03 09:18
egg781: 是不是有點哲學問題?人類也是通過學習,AI只是因為學超快17F 04/03 09:18
melzard: 現在還騙不過 以後就越來越難說18F 04/03 09:18
Innofance: Pixiv盈利禁AI好不好==19F 04/03 09:19
error405: 前幾天產的色圖丟pixiv現在破50follow惹20F 04/03 09:20
pikachu2421: pixiv只有fanbox有禁AI喔 pixiv本身和booth都沒禁21F 04/03 09:20
bnn: 因為主要賣錢的都是人類偏好 你牆上貼一根香蕉真的很多人買嗎還是你放一個馬桶或排排放campbell罐頭比較常放家裡當裝飾畫22F 04/03 09:21
driftcreator: openai有出paper, 他們不是使用當前主流的堆疊方式24F 04/03 09:22
目前只有blog跟一些片段資訊維持過往closeAI不透露模型架構細節,但從中推測很有可能
類似去年字節那套VAR的方法也就是讓圖片是天然跟語言一起學習的,這樣生成出來的東西
理論上是更具備潛力而且可以透過多輪指令遵循改進圖片生成結果。
melzard: 牆上貼香蕉真的挺好笑的25F 04/03 09:22
bnn: 而當你有那個創意後 你扔這個創意去AI也可以幫你畫完
如果你要立體的香蕉 市場買一根 或是大費周章3D列印一個塑膠不過如果你把藝術當成裝逼吸引貴婦包養用的爬窗戶手段 那沒了以前的各種畫舔大公或是取悅資助者的畫 就是人類偏好26F 04/03 09:23
Innofance: Booth沒禁,但是Pixiv是禁止AI盈利的,自己去翻條文唄30F 04/03 09:27
pikachu2421: pixiv上便都能找到AI開request的 pixiv也沒在管就是*隨便31F 04/03 09:28
Innofance: 管是有在管,但只能說管不過來就是,畢竟開Request不用審核。就連有審核制度的米畫師都混一堆進去了33F 04/03 09:30
bnn: 順便一提 版畫這個當年也被說沒有手繪的靈魂和溫度
後來也變成每一張都有其獨特的耗損和特色 版印到壞了就沒了35F 04/03 09:31
driftcreator: 目前影像生成的新代模型, 閉源OpenAI跟Google領頭37F 04/03 09:33
pikachu2421: pixiv request禁止行為和禁止商品都沒寫到AI
是寫在哪裡啊 沒找到...
搜尋了一下好像只寫在一篇公告 但是規約沒有寫...38F 04/03 09:35
Innofance: pixivリクエスト クリエイターガイド
規約的話,寫在「リクエスト機能個別規約」41F 04/03 09:49
pikachu2421: https://www.pixiv.net/request/policy
這個頁面的規約沒更新 難怪沒看到...43F 04/03 09:57
イラスト コミュニケーションサービス[pixiv(ピクシブ)]
[圖]
pixiv(ピクシブ)は、作品の投稿・閲覧が楽しめる「イラストコミュニケーションサービス」です。幅広いジャンルの作品が投稿され、ユーザー発の企画やメーカー公認のコンテストが開催されています。 ...

 
Innofance: 他規約其實沒有寫明,但是內容可以引導到ガイドライン45F 04/03 09:59
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 10:01:05
--
作者 sxy67230 的最新發文:
點此顯示更多發文記錄