作者 error405 (流河=L)標題 [閒聊] viduQ3影片動畫生成模型 日本關注時間 Tue Feb 3 08:49:23 2026
https://www.itmedia.co.jp/aiplus/articles/2602/02/news075.html
以下是 Vidu Q3 的相關資訊整理(基於文章 + 最新公開資訊,截至2026年2月):基本
資訊開發公司:ShengShu Technology(中國 AI 初創,與清華大學等有合作背景)。
發布時間:2026年2月初(文章於2月2日報導,屬於近期新模型,作為 Vidu 系列的 Q3
版本)。
官方平台:Vidu AI 官網(vidu.com),支援 Web 服務 + API。
核心賣點:業界首個在單一生成流程中同時輸出原生音訊 + 影片的長影片模型(native
audio-video generation),不再需要後製配音。
主要功能與規格影片長度:最長 16 秒(業界領先,多數模型如前代僅 2-8 秒)。
輸入方式:文字提示(Text-to-Video)、圖片輸入(Image-to-Video)、多模態。
音訊支援:直接生成語音旁白 + 唇形同步(lip-sync),支援日語、英語、中文等多語
言。日語表現特別突出,尤其是「動漫聲」(anime voice)品質高、讀起來自然,口型
同步違和感低。
畫質與格式:Web 端輸出 1080p(可選 16:9、9:16、1:1 等比例),支援 2K/4K 升級(
部分功能)。
進階控制:提示可指定鏡頭運動(pan、tilt、dolly 等)、切換鏡頭(multi-shot / 智
能分鏡)、轉場。
其他特色:物理模擬更強、畫面一致性高、支援字幕內嵌生成(非後製)。
與其他模型比較(文章與網路印象)優於 OpenAI Sora 2:提示追隨度更好(尤其是鏡頭
運動與切換),lip-sync 更自然。
整體被視為 Sora、Kling、Runway、Luma、Veo 等競爭對手中的強勁新秀,尤其在音畫同
步與日語/動漫風格上領先。
缺點:生成時間較長(8-10 秒影片可能需數分鐘到 10 分鐘),有時需排隊。
日本走紅原因日本 X 用戶大量分享用 Vidu Q3 生成的動漫風格影片,日語發音 + 動漫
聲優般的語調讓人驚艷,唇形同步自然。
文章作者親測後也認同:「日本語読み上げの精度は高く、特に“アニメ声”のクオリテ
ィーは高い」「リップシンクも違和感が少なく」。
動漫、Vtuber、輕小說相關創作者特別感興趣,因為能快速做出帶聲音的短動畫片段,省
去配音麻煩。
官方也有日文社群(如 @vidujapan
),並在 PR 中強調適合日本創作者。
使用與價格Web 端:直接上 vidu.com 註冊使用(有免費額度或試用)。
API 價格:1080p 約 $0.16 / 秒(非高峰期可能半價),支援更低解析度。
許多第三方平台(如 fal.ai、Dzine、Media.io、Pollo AI 等)也整合 Vidu Q3 模型,
可免費或低成本試玩。
--
以上grok整理
以下轉5ch
https://www.youtube.com/watch?v=XDvyLTlOaKY
https://reurl.cc/dqMA58
https://reurl.cc/jmno5Z
https://reurl.cc/QVvx7p
https://reurl.cc/Vmdl35
https://reurl.cc/qKl6mn
https://reurl.cc/aMWA57
至少在日文配音這部分算是有一定實力
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.217.153 (臺灣)
※ 作者: error405 2026-02-03 08:49:23
※ 文章代碼(AID): #1fWKOOLB (AI_Art)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770079768.A.54B.html