[閒聊] viduQ3影片動畫生成模型日本關注 - AI_Art板

作者 error405 (流河=L)
標題 [閒聊] viduQ3影片動畫生成模型日本關注
時間 Tue Feb 3 08:49:23 2026

https://www.itmedia.co.jp/aiplus/articles/2602/02/news075.html

日本語の“アニメ声”に強い？　中国から新たな動画生成AIモデル「Vidu Q3」登場 - ITmedia AI＋ 中国のAIスタートアップShengShu Technologyは2月2日までに、動画生成AIの新モデル「Vidu Q3」を発表した。APIに加え、Webサービスとしても提供しており、テキストや画像を基に日本語・英語・中国語の音声付き動画を最大16秒まで生成可能。発話者の口の動きを音声と合わせるリップ ...

以下是 Vidu Q3 的相關資訊整理（基於文章 + 最新公開資訊，截至2026年2月）：基本
資訊開發公司：ShengShu Technology（中國 AI 初創，與清華大學等有合作背景）。
發布時間：2026年2月初（文章於2月2日報導，屬於近期新模型，作為 Vidu 系列的 Q3
版本）。
官方平台：Vidu AI 官網（vidu.com），支援 Web 服務 + API。
核心賣點：業界首個在單一生成流程中同時輸出原生音訊 + 影片的長影片模型（native
audio-video generation），不再需要後製配音。

主要功能與規格影片長度：最長 16 秒（業界領先，多數模型如前代僅 2-8 秒）。
輸入方式：文字提示（Text-to-Video）、圖片輸入（Image-to-Video）、多模態。

音訊支援：直接生成語音旁白 + 唇形同步（lip-sync），支援日語、英語、中文等多語

言。日語表現特別突出，尤其是「動漫聲」（anime voice）品質高、讀起來自然，口型
同步違和感低。

畫質與格式：Web 端輸出 1080p（可選 16:9、9:16、1:1 等比例），支援 2K/4K 升級（
部分功能）。
進階控制：提示可指定鏡頭運動（pan、tilt、dolly 等）、切換鏡頭（multi-shot / 智
能分鏡）、轉場。
其他特色：物理模擬更強、畫面一致性高、支援字幕內嵌生成（非後製）。

與其他模型比較（文章與網路印象）優於 OpenAI Sora 2：提示追隨度更好（尤其是鏡頭
運動與切換），lip-sync 更自然。
整體被視為 Sora、Kling、Runway、Luma、Veo 等競爭對手中的強勁新秀，尤其在音畫同
步與日語/動漫風格上領先。
缺點：生成時間較長（8-10 秒影片可能需數分鐘到 10 分鐘），有時需排隊。

日本走紅原因日本 X 用戶大量分享用 Vidu Q3 生成的動漫風格影片，日語發音 + 動漫
聲優般的語調讓人驚艷，唇形同步自然。
文章作者親測後也認同：「日本語読み上げの精度は高く、特に“アニメ声”のクオリテ
ィーは高い」「リップシンクも違和感が少なく」。
動漫、Vtuber、輕小說相關創作者特別感興趣，因為能快速做出帶聲音的短動畫片段，省
去配音麻煩。
官方也有日文社群（如 @vidujapan
），並在 PR 中強調適合日本創作者。

使用與價格Web 端：直接上 vidu.com 註冊使用（有免費額度或試用）。
API 價格：1080p 約 $0.16 / 秒（非高峰期可能半價），支援更低解析度。
許多第三方平台（如 fal.ai、Dzine、Media.io、Pollo AI 等）也整合 Vidu Q3 模型，
可免費或低成本試玩。

--
以上grok整理

以下轉5ch
https://www.youtube.com/watch?v=XDvyLTlOaKY

https://reurl.cc/dqMA58

Jump@5ch

https://reurl.cc/jmno5Z

Jump@5ch

https://reurl.cc/QVvx7p

Jump@5ch

https://reurl.cc/Vmdl35

Jump@5ch

https://reurl.cc/qKl6mn

Jump@5ch

https://reurl.cc/aMWA57

Jump@5ch

至少在日文配音這部分算是有一定實力

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.217.153 (臺灣)
※ 作者: error405 2026-02-03 08:49:23
※ 文章代碼(AID): #1fWKOOLB (AI_Art)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770079768.A.54B.html

※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 08:54:37

推 AoWsL: 效果確實比Q2進步蠻多的..不過要摸熟還是選最高方案吧
一個月兩三千那個
2／1速度
https://i.urusai.cc/3nNRf.gif
生一張費用90~150點（最長16秒）
沒有錯峰模式所以... 打出來的影片都是真金白銀
https://i.urusai.cc/clOIs.gif1F 02/03 12:11

→ AoWsL: 你連結好像都是壞掉的8F 02/03 12:28

https://greta.5ch.net/test/read.cgi/poverty/1770024160/

中国の動画生成AI「Vidu Q3」が凄すぎてアニメーターと声優が不要になる [886272898] ５ちゃんねるのニュース速報（嫌儲） mango shake!での議論に参加しましょう：「中国の動画生成AI「Vidu Q3」が凄すぎてアニメーターと声優が不要になる [886272898]」。 ...

縮址也不行那我放原討論串
※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 12:38:26

推 ZMTL: https://i.imgur.com/Wgg6Gy8.jpeg 今天看到的
但我不太確定哪邊是t2v哪邊是i2v，但sora2的i2v理論上是倒數的9F 02/03 15:56

→ AoWsL: Artificial Analysis
右邊T2V 。不錯了啦...I2V確實沒Kling強 Kling要出3.0了
http://i.imgur.com/FisD2Yh.jpg
http://i.imgur.com/MdAijuZ.jpg12F 02/03 16:06

→ error405: LMArena資料還沒更新16F 02/03 16:12

→ AoWsL: http://i.imgur.com/mEdR4w8.jpg17F 02/03 16:40

→ error405: https://x.com/search?q=Vidu Q318F 02/03 22:10

作者 error405 的最新發文:

+13 [閒聊] 又有超強小模型? Qwen3.6-27B - AI_Art 板

作者: error405 114.36.252.228 (台灣) 2026-04-24 11:18:58

23F 13推
+2 Re: [分享]把 Gem的文字冒險互動遊戲轉換為網頁遊戲 - AI_Art 板

作者: error405 114.36.252.228 (台灣) 2026-04-23 14:25:53

8F 2推
+6 [閒聊] 印度學生利用AI打造MAGA網紅賺取數千美元 - AI_Art 板

作者: error405 114.36.252.228 (台灣) 2026-04-23 09:54:12

6F 6推
+2 [情報] AI影片免費無限生? AI Video Maker - AI_Art 板

作者: error405 220.136.195.115 (台灣) 2026-04-21 22:03:57

10F 2推
+6 Re: [閒聊] 有人用過GPT-image-2 了嗎 - C_Chat 板

作者: error405 114.36.243.215 (台灣) 2026-04-19 18:49:01

6F 6推

點此顯示更多發文記錄