看板 PC_Shopping作者 ck3300503 (夏影)標題 [測試] 幾個CPU的H264轉碼測試+CUDA時間 Sun Jun 16 22:12:00 2013
個人有在字幕組 正好最近有在幫忙最後編碼的部分
就順便來測試一下手邊各種CPU轉碼的效能
因為手邊可用測試平台不多 測試方法也不算很嚴謹 大家就參考一下了
之所以不直接用x264 Benchmark來做 是因為我想以實際轉檔的方式來測
會更接近平常實作會用到的吧
(為減少I/O造成的誤差 所有測試一律使用SSD)
測試環境(共同部分)
Windows 8 X64
MediaCoder x64 0.8.18.5335
868x480的一個16分32秒動畫
配上ass格式字幕 直接內嵌上去
使用以下avs script
--------------------------------------------
LoadPlugin("C:\avsfilter\ffms2.DLL")
LoadPlugin("C:\avsfilter\VSFilter.DLL")
V="C:\h264test\test.mp4"
A="C:\h264test\test.mp4"
AudioDub(FFVideoSource(V),FFAudioSource(A))
TextSub("C:\h264test\test.ass")
--------------------------------------------
轉碼設定使用x264編碼器 2-pass模式
位元速率設為1000Kbps
音效部分使用LC-AAC 128Kbps
接下來是各CPU的實測結果(單位秒)
Intel Core i7 3930K@3.2Ghz
---------------------------------------------------------
使用執行緒 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
12 65 100 165
6 67 146 213
4 83 210 293
---------------------------------------------------------
Intel Core i7 950@3.06Ghz
---------------------------------------------------------
使用執行緒 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
8 91 163 254
4(HT沒關) 97 259 356
4(HT關掉) 103 203 306
---------------------------------------------------------
單純比第一項和第三項 可以看出HT技術對轉檔方面還是有顯著的提升的
HT沒關使用4個執行緒效能比關HT低 也是意料之中,
畢竟後者是相對完整使用了4個核心
AMD Phenom X4 965@3.4Ghz
---------------------------------------------------------
使用執行緒 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
4 156 267 423
---------------------------------------------------------
Intel Core i3 530@2.93Ghz
---------------------------------------------------------
使用執行緒 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
4 181 384 565
---------------------------------------------------------
完整CPU比較
---------------------------------------------------------
CPU 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
3930K 65 100 165
i7 950 91 163 254
X4 965 156 267 423
i3 530 181 384 565
---------------------------------------------------------
同樣4執行緒比較
---------------------------------------------------------
CPU 2-pass第一階段 2-pass第二階段 總時間
---------------------------------------------------------
3930K 83 210 293
i7 950(關HT) 103 203 306
i7 950(開HT) 97 259 356
X4 965 156 267 423
i3 530 181 384 565
---------------------------------------------------------
同場加映
使用CUDA轉碼的結果
顯卡是GTX680
CPU i7 3930K@3.2Ghz
因為CUDA似乎無法使用2-pass 所以使用ABR 1000KBps的設定來測
使用CUDA編碼 74秒
純CPU編碼 109秒
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.246.9
→ y3k:這版上前一陣子就有在作了 按/搜尋x264吧6F 06/16 22:44
推 ckgegg:肥龍II真的猛 不愧是一代神U7F 06/16 22:45
→ friedpig:有Cuda VS 純CPU的畫質比較嗎?8F 06/16 22:51
之前也想到要比 結果忘了XD
CPU轉的結果
http://www.nctucs.org/h264/cpu.jpg
CUDA轉的結果
http://www.nctucs.org/h264/cuda.jpg
CPU轉的看起來好很多 也許是參數還要調整吧 我目前都是用預設值的
※ 編輯: ck3300503 來自: 140.113.246.9 (06/16 22:58)
推 kkkkkkq:可以順便測這個嗎? Intel Quick Sync Video Technolo9F 06/16 23:00
→ friedpig:覺得這解析度看起來差異勉強能接受 不過放大應該更嚴重10F 06/16 23:00
推 s25g5d4:畫面根本不對了 怎接受-.-12F 06/16 23:01
→ ck3300503:Intel Quick Sync Video 我沒有能用的U貌似@@14F 06/16 23:03
→ kkkkkkq:好可惜QQ 想要畫值X264已經開始支援opencl
只是他只是讓顯卡協助 沒有都用顯卡轉15F 06/16 23:06
→ friedpig:不就糊了"一點"(? 不過兩張圖怎麼比例不太一樣?18F 06/16 23:32
推 s25g5d4:有整整好幾行像素被吃了19F 06/16 23:38
推 cckkyle:色彩有差 對收藏的有差20F 06/16 23:40
→ y3k:CUDA鄍X來的品質普遍非常差 因為寫的時候都是以速度21F 06/16 23:45
推 E6300:CUDA被拉寬了22F 06/16 23:46
→ y3k:優先 我個人是很懷疑CUDA如果要輸出好品質會不會根本比不上哀七打樁之流....23F 06/16 23:46
→ ck3300503:是啊..其實也沒比3930K快到多少
品質卻差了不少25F 06/16 23:48
推 lightwings:CUDA轉比較糊的原因據說是很多濾鏡之類的不支援啦27F 06/16 23:49
→ friedpig:我是覺得優庫土豆之流的低解析度串流撥放的話應該沒28F 06/16 23:49
→ lightwings:朋友之前搞了很久,最後還是放棄乖乖用CPU...29F 06/16 23:50
→ friedpig:差 真的要看高清 這個好恐怖
而且這解析度不是特別高吧? FullHD下去應該更慘?30F 06/16 23:50
→ kkkkkkq:CUDA轉檔已經被NV遺棄了XD 現在推NVENC
新的開普勒核心才能跑33F 06/16 23:53
→ coldcolour:原PO那個CUDA範例在我眼裡是慘不忍睹的等級...35F 06/17 00:00
→ friedpig:我的想法是這解析度兩張全螢幕都差不多慘 所以能接受36F 06/17 00:03
→ y3k:樓上去嘗試看看madVR 開高級放大濾鏡吧37F 06/17 00:11
推 denix:cuda一堆鋸齒......38F 06/17 10:52
推 tom19960222:同為字幕組路過 用過疑似CUDA的源 只有悲劇的份..41F 06/18 01:50
→ tonyhsie:x264 Benchmark 就是實際轉檔啊....
用同一個benchmark比較方便跟其他人的數據作比較42F 06/19 22:41
→ Litfal:問題是真正壓片時,AVS濾鏡往往才最吃效能Orz44F 06/20 13:16
--