5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

【x264+Avisynth】実用エンコベンチ Part5.1 [無断転載禁止]©2ch.net

1 :Socket774:2016/04/07(木) 21:34:26.34 ID:zcrOJ+Cg
x264ベンチ報告スレです。

ベンチマークセットはここ
https://drive.google.com/file/d/0B8Fsw9b9NGgXS05ibE9RZUExQTg/edit?usp=sharing

構成はこんな感じで
【CPU】
【MEM】
【M/B】
【GPU】
【SSD/HDD】
【OS】
【x264】

前スレ
【x264+Avisynth】実用エンコベンチ Part4
http://potato.2ch.net/test/read.cgi/jisaku/1397956056/

152 :Socket774:2016/12/21(水) 19:15:56.45 ID:Lc7Nyxx2
俺もやってみた。
消費電力除けば、BroとHasのコア性能はそんなに変わらないという、
当たり前の結果に。

【CPU】i7-5960X@4.3GHz
【MEM】DDR4-2400 4GB x 4
【M/B】ASUS X99-DELUXE
【SSD】Intel 750 400GB
【OS】 Win10 pro 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 61.77 fps
【. Medium】 29.58 fps
【   Slow】 12.51 fps

>>151
結局H264/H265どちらも、整数演算しか使わないので、
浮動小数点のみのAVXじゃ、ロード・ストア系除く命令は使い道が無いってだけじゃ。

153 :Socket774:2016/12/21(水) 20:07:15.04 ID:bBYxkQrp
話の筋的にはAVX2も含む

154 :Socket774:2016/12/21(水) 21:48:35.03 ID:CsQENohl
Bloomfieldでもやってみた。世代の割には頑張るね。
ただこのクロックだとFX-8350より熱いw

x265 Benchmark

【CPU】 i7-930(3.8GHz Uncore3.2GHz)
【MEM】 DDR3-1600 4GBx6
【M/B】 GA-X58A-UD7 rev1.0
【SSD】 HDS722020ALA330
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 17.40 fps
【. Medium】 9.30 fps
【  Slow】 3.94 fps

155 :Socket774:2016/12/21(水) 23:10:29.98 ID:HWW+vDiz
5960Xと980XのついでにQ9650でも試してみた

【CPU】Core2 Quad Q9650@3.6GHz
【MEM】DDR2-1066 2GB x 2
【M/B】ASUS P5Q-E
【SSD】Crucial BX100 250GB
【OS】 Windows10 Home 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1

【Veryfast】 9.04 fps
【. Medium】 4.98 fps
【   Slow】 2.00 fps

156 :Socket774:2016/12/21(水) 23:17:29.36 ID:VBi+RUO3
>>124
>>155
x264だとコア数の差がそのまま出て1.5倍ほど速いであろう
PhenomII X6 1100T@3.8GHzが、x265だと
逆に1.5倍差付けられて負けてるところが興味深いな

157 :Socket774:2016/12/21(水) 23:31:53.76 ID:ascnGhxd
【CPU】i7-4702MQ(Haswell)
【MEM】DDR3 8GB
【GPU】Intel HD4600
【OS】Win10 Anniversary Home x64
【x265】2.1+70(x64)

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】21.72 fps
【 Medium】11.08 fps
【   Slow】 4.44 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】21.38 fps
【 Medium】10.92 fps
【   Slow】 4.30 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】16.57 fps
【 Medium】 8.77 fps
【   Slow】 3.72 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】16.31 fps
【 Medium】 8.53 fps
【   Slow】 3.65 fps

158 :Socket774:2016/12/22(木) 08:33:07.18 ID:iGZiIH1t
x265_Benchmark

【CPU】Xeon E5 2650L v3 定格 HT 無効/TB 有効
【MEM】DDR4-2133 16GB x4
【M/B】ASRockRack EPC612D4i
【SSD】Crutial CT250MX200SSD1
【OS】 Windows Server 2012 R2 Update
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 35.40 fps
【. Medium】 18.32 fps
【   Slow】 7.35 fps

12c 2.1Ghz じゃそこまで早くはならないぽ

159 :Socket774:2016/12/22(木) 09:01:39.77 ID:FwjGpy84
x265 Benchmark

【CPU】 i7-3930k@4.0GHz
【MEM】 DDR3-1866 4GBx4
【M/B】 X79 Professional
【SSD】 Crucial MX100 512GB
【OS】 Windows7Pro x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX

【Veryfast】 26.61 fps
【. Medium】 14.87 fps
【  Slow】 6.44 fps

160 :Socket774:2016/12/22(木) 12:27:48.82 ID:35fahdgU
x265

i5 6600 定格
ddr4 2133 x2
h110m hdv
ssd seagete 600 240GB

slow 5.7 fps

161 :Socket774:2016/12/22(木) 12:30:09.32 ID:35fahdgU
i7 4770 に近いぐらいのスピード出ててびっくり
h265は skylake 有利だね

162 :Socket774:2016/12/22(木) 13:46:35.85 ID:1qTSMMqR
E5 2650L v3 なら >>108 と同じくらいの CPU クロック合計なのに速度出ないの残念だ…

163 :Socket774:2016/12/22(木) 15:33:25.79 ID:RzAAUxH9
x265でスレが盛り上がっていいぞ〜

164 :Socket774:2016/12/22(木) 18:15:58.62 ID:P48w/RJH
>>119だけど、K10の切り捨てられっぷりが話題になってたので
更に無謀にも --no-asm でもやってたみ

265_Benchmark

【CPU】AthlonII X2 240e
【MEM】DDR3-1600 2GBx2
【M/B】MSI 880GM-E41
【SSD】Plextor PX-256M5S
【OS】 Win10 Poe x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast LZCNT
【Veryfast】 1.52 fps
    ↓
【拡張命令】 none!
【Veryfast】 0.89 fps

K10はアセンブラコード無しと有りで1.7倍しか変わらない

一方でx264と同じような比較してみると
【x264】r2334 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSEMisalign LZCNT
【Veryfast】 10.90 fps
    ↓
【拡張命令】 none!
【Veryfast】 2.03 fps

って感じで5倍差が出てる
>>134のi7-4770みたいに7倍とはいかなくても
4倍差くらいあったら>>124の1100Tあたりはまだ頑張れそうなのに

165 :Socket774:2016/12/22(木) 18:56:24.90 ID:CsnhnEI/
K10向けにカリカリに最適化してもそんな伸びないよ
アムドの拡張命令実装は大概「とりあえず動く」レベルであって、性能が出るレベルじゃない
ZenもAVXがDoublePath、BMIはVectorPathなんて仕様だから、あんま期待しない方がいい
純スカラ整数コードならイッテルの4Cは軽く蹴散らし、うまくすると6Cとも張り合えるだろうが
エンコだと4Cにも勝てるかどうか怪しい

166 :Socket774:2016/12/22(木) 19:34:13.07 ID:QCBwn+5y
田村は他でやってね

167 :Socket774:2016/12/22(木) 20:21:21.95 ID:8o8dpJYf
DTVやソフ板なら宗教戦争持ち込むなハゲ、の一言で済むけどここ自作PC板なんだよな
ま、コアの性能自体は置いといて、エンコは基本マルチコア化が超有効だから4コアに負けることは無いはず
例えばIntelでのx265はAVX2の有無で30%の性能差があるが、コア数が倍になれば所要時間はほぼ半分になるし

168 :Socket774:2016/12/22(木) 20:26:07.58 ID:Gbl4UwPE
そうか?

169 :Socket774:2016/12/22(木) 20:29:05.06 ID:KQ/lkdvF
8コアでもイソテル4コアに負けるのがAMD

170 :Socket774:2016/12/22(木) 20:35:39.25 ID:8o8dpJYf
実のところBulldozer(モジュール)は2スレッド実行できる1コアだよ
>167の書き方が悪いんだけど、最後の段落はIntelにも当てはまるのは分かるでしょ

171 :Socket774:2016/12/22(木) 22:49:43.88 ID:+kc8Fkcq
自作ではないけど比較用に。2C2Tではこんなものかな

x265 Benchmark

【CPU】 Celeron N2820(2.4GHz)
【MEM】 DDR3-1333 2GBx2
【M/B】 DN2820FYKH
【SSD】 SanDisk Extreme PRO 480GB
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 1.82 fps
【. Medium】 0.96 fps
【   Slow】 0.42 fps

172 :Socket774:2016/12/23(金) 00:16:06.63 ID:K3WuwBFD
やっと265の時代か 

173 :Socket774:2016/12/23(金) 00:58:48.34 ID:mdrOl6nv
x264も大分変わったからまたやらないといけないな

174 :Socket774:2016/12/23(金) 04:45:27.17 ID:4ULyquge
エンコの宝刀・AVX2はcoreシリーズだけの装備なのか…

175 :102:2016/12/23(金) 09:08:02.44 ID:/VJqy3uU
>>141
> HTの効率はx264に比べて若干低め?

HTの効果の度合いをx265とx264で比較してみた

【CPU】i7-4770(定格:エンコ中全コア3.7GHz)
【MEM】DDR3-1600 4GBx2
【M/B】ASUS H87M-Pro
【SSD】Plextor PX-M5S
【OS】 Win7 x64 Pro
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

  HT無し(4C4T)  →  HT有り(4C8T)

【x265】2.1+70 (x64)
【Veryfast】 24.76 fps → 29.15 fps (+17.7%)
【. Medium】 12.82 fps → 14.54 fps (+13.4%)
【   Slow】 5.38 fps → 5.98 fps (+11.2%)


【x264】r2638 (x64)
【Veryfast】 52.33 fps → 62.30 fps (+19.1%)
【. Medium】 14.01 fps → 16.71 fps (+19.3%)
【   Slow】 6.64 fps → 7.62 fps (+14.8%)


推察の通りにx264に比べると、x265はHTの優位性は少し低いね

176 :Socket774:2016/12/23(金) 10:04:55.00 ID:z7gvtvVC
i5とi7だと4割近く上がってるはずだけど(x264で)それどうやってON/OFFで計測したの?
エンコーダー側のスレッド数を変えた感じ?

177 :Socket774:2016/12/23(金) 10:25:57.59 ID:/VJqy3uU
マザーのUEFIでHTT有効/無効が切り替えられる

178 :Socket774:2016/12/23(金) 10:28:02.13 ID:/VJqy3uU
それと、同クロックでさすがにHTTの有無では4割も差は出てないよ
過去のこのスレの数々の結果かから見ても

179 :Socket774:2016/12/23(金) 10:52:38.06 ID:z7gvtvVC
そうなの?
価格.comの掲示板で4割近く上がるからi7絶対おすすめって書かれてたから
そうなのかと思ってた

180 :Socket774:2016/12/23(金) 10:55:03.86 ID:K3WuwBFD
sky傾向なら十分実用的になったな

181 :Socket774:2016/12/23(金) 11:19:43.98 ID:K3WuwBFD
ここ見ててマザーで切り替えられるの知らないとかネタだろwwwさすがに

182 :Socket774:2016/12/23(金) 11:57:01.35 ID:/QeKjCI0
【CPU】i7 6950X@4.35GHz(127.9*34), Cache@3.71GHz
【MEM】G.Skill F4-3400C16Q-16GRBD@DDR4-3410 16-18-18-38 1T
【M/B】ASUS Rampage V Extreme
【SSD】SanDisk Extreme PRO 480GB
【OS】 Windows7 Pro 64bit SP1
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 75.87 fps
【. Medium】 37.02 fps
【.  Slow】 15.07 fps


あとベンチ用の元動画を適当に4K(3840x2160)にリサイズ、再エンコして4Kで測定できるようにしてみた

x265_Benchmark_4K対応版
https://1drv.ms/u/s!Akfj_vsVPKU9gjcuOu3swPN98u-7

x265_Benchmark_3840

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 20.84 fps
【. Medium】 9.18 fps
【.  Slow】 4.08 fps

183 :182:2016/12/23(金) 12:28:22.64 ID:/QeKjCI0
OneDriveのURLがInvalid URIになってしまうようなので
https://drive.google.com/file/d/0B8o-zISICm3lRXg4dTdaVnBOWkk/view?usp=sharing

184 :Socket774:2016/12/23(金) 13:08:22.69 ID:eqByT/Ck
6950Xといえども流石に4KではMedium 10fps超えは無理か

185 :Socket774:2016/12/23(金) 13:13:59.44 ID:K36congF
2万3万円の普通に売っているCPUで、4kをまともな速度でエンコできるようになるには
もう3回か4回くらいシュリンクやアーキテクチャ変更が必要じゃねえ

186 :Socket774:2016/12/23(金) 13:28:20.93 ID:4CPAJTU4
あと2,3世代で頭打ちと言われてる

187 :182:2016/12/23(金) 14:04:53.36 ID:/QeKjCI0
--pools 64 --frame-threads 16 オプションつけたらCPU使用率が上がって若干早くなった

x265_Benchmark(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 83.50 fps
【. Medium】 38.88 fps
【.  Slow】 15.80 fps

x265_Benchmark_3840(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 21.69 fps
【. Medium】 9.73 fps
【.  Slow】 4.23 fps

4KだとMedium以上でCPUほぼ100%使い切るようになった

188 :Socket774:2016/12/23(金) 14:43:46.27 ID:K3WuwBFD
>>185
10コアぐらいが普通にならないときついんかね

189 :Socket774:2016/12/23(金) 14:45:38.14 ID:K3WuwBFD
fhdの265で もうかなり満足な画質だけどねえ

190 :Socket774:2016/12/23(金) 14:59:57.65 ID:qFQdMT4m
そもそもx265がまだ未成熟だというのを忘れてはいけない
今年も速度が向上したり機能が追加されたりしている

191 :Socket774:2016/12/23(金) 15:44:13.37 ID:z7gvtvVC
現状から劇的に上がるのかねぇ
今の停滞が次のジャンプのための準備期間だったらいいんだが

192 :Socket774:2016/12/23(金) 15:53:56.41 ID:rdeNfqjo
停滞してるなんて思わないなあ
まあもっと軽くはなって欲しいけど

193 :Socket774:2016/12/24(土) 01:57:46.76 ID:Uu3jzn1g
HTTの利点は、よりフルロードに貼り付けやすくするだけだから
過多スレッドでブン回して100%に貼り付けたら同クロック動作の4Cなi7とi5ならキャッシュの差しか無い
逆に100%張り付かないエンコーダやベンチ、ゲームなんかではCPUロードが稼ぎやすくTurboBoostのクロックも高く推移させやすくなるから重宝されるし価値がある

194 :Socket774:2016/12/24(土) 07:38:31.79 ID:LEOxNhyp
        ____
        /     \
     /   ⌒  ⌒ \   何言ってんだこいつ
   /    (●)  (●) \
    |   、” ゙)(__人__)”  )    ___________
   \      。` ⌒゚:j´ ,/ j゙~~| | |             |
__/          \  |__| | |             |
| | /   ,              \n||  | |             |
| | /   /         r.  ( こ) | |             |
| | | ⌒ ーnnn        |\ (⊆ソ .|_|___________|
 ̄ \__、(“二) ̄ ̄ ̄ ̄ ̄l二二l二二  _|_|__|_

195 :Socket774:2016/12/24(土) 08:36:34.57 ID:3bIdIGKY
このベンチは4C4Tでやっても8C8Tでやっても
同じく100%付近に張り付いたまま>>175の差が出るってことを
知らずに書いてるのは間違いない

196 :Socket774:2016/12/24(土) 08:37:00.30 ID:3bIdIGKY
8C8Tじゃなくて4C8Tだ

197 :Socket774:2016/12/24(土) 13:19:49.00 ID:Nag5DyNj
【CPU】i7-6700(全コア3.7GHz -offset0.16V)
【MEM】DDR4-2133 8GB x 4
【M/B】ASUS Z170M-PLUS
【SSD】CT960M500
【OS】 Win7 Pro x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 34.14 fps
【. Medium】 16.87 fps
【   Slow】 6.83 fps

アイドル 26W、x265エンコ 75W、x264エンコ 75W、OCCT LINPAK 88W、Prime95v2810 96W
同じソースを使ってGTX1050Ti NVEncC CQPエンコ時max84W
HEVC 246.94fps、HEVC 10bit 255.03fps、HEVC YUV444 10bit 153.39fps

198 :Socket774:2016/12/24(土) 14:12:46.64 ID:XtzQctDZ
NVEncはさすがに品質が糞すぎるのでせめてQSVのICQと比べておくれ

199 :Socket774:2016/12/24(土) 17:03:28.62 ID:2qDLwNHB
>>197
やっぱりSkylakeはx265大得意だな

200 :Socket774:2016/12/24(土) 17:27:59.97 ID:EkX2J8zn
>>199

>A key improvement in Skylake is the internal ring bus, which has double the memory bandwidth of the previous CPU generation (Haswell/Broadwell).
>The internal ring moves data inside the CPU, from cache memory to logic units in each core, and back again.
>Our performance profiling shows that x265 performance is often constrained by the memory bandwidth of Haswell generation cores which is about 20 GB/sec.
>Skylake cores have about 40 GB/sec bandwidth, removing this bottleneck.

>For 4K encoding on a quad-core desktop, we see a memory bandwidth bottleneck on Haswell processors with our fastest presets (ultrafast, superfast).
>Under this condition, Skylake can outperform Haswell by more than 2x.

開発者曰くSkylakeでメモリ帯域のボトルネックが改善されたのが大きいとか
4K動画を軽いプリセットでエンコする時は特に有効とのこと

201 :Socket774:2016/12/24(土) 17:30:53.41 ID:2qDLwNHB
>>200
リングバス帯域が2倍になってたんだな

202 :Socket774:2016/12/24(土) 17:37:47.07 ID:Y5hbEkea
>>198
ラデのハードエンコやってみた。平均86fpsぐらい
qp20~35でエンコしたファイルとオリジナルのやつ(ここのx265ベンチのやつ)のzip
https://www.axfc.net/u/3756042/clickads

203 :Socket774:2016/12/24(土) 20:09:01.91 ID:Nag5DyNj
>>198
QSVのICQでもNVENCのCQPと画質は大して差が無いし、8bitだと品質を上げても暗部にビットレートを割かないのでバンディングやブロックノイズが酷くて低画質
NVENCのH.265 10bit以上の設定だと暗部の処理が目に見えて向上しているから、速度差も有るし8bitのみのQSVだと使うことは無いかな

ベンチのテスト結果ログ出力用batが無いみたいなので【テスト開始.bat】を作成
http://fast-uploader.com/file/7038132301044/

204 :Socket774:2016/12/24(土) 20:48:33.75 ID:qpdQ/8rp
nvenc 画質結構上がってるだろw
265とかソフトの264レベルあるぞ

205 :Socket774:2016/12/24(土) 20:54:49.86 ID:8icu6wdi
QSVはサイズがデカイ

206 :Socket774:2016/12/24(土) 22:30:20.48 ID:ZzzD5VZu
旧世代だけど多コア参戦。10C20T×2の計40T。
【CPU】Xeon E5-2660 V3×2個
【MEM】Crucial 4GB Reg.ECC×8個
【M/B】Supermicro X10DAi
【HDD】-
【SSD】Intel 910 400GB
【OS】 Win10 64bit

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

x265_Benchmark
【Veryfast】 64.52 fps CPU使用率60% CPUクロック2.8GHz
【. Medium】 28.99 fps CPU使用率50% CPUクロック2.8GHz
【  Slow】 12.00 fps CPU使用率45% CPUクロック2.8GHz

x265_Benchmark_3840
【Veryfast】 20.35 fps CPU使用率70〜80% CPUクロック2.7〜2.9GHz
【. Medium】 8.77 fps CPU使用率60〜70% CPUクロック2.8〜2.9GHz
【   Slow】 4.06 fps CPU使用率60〜80% CPUクロック2.7〜2.9GHz

さすがにCPU使用率100%にはならず。
次回更新予定のSkylake-EPでは高クロックモデルにしますわ・・・

207 :Socket774:2016/12/25(日) 00:08:57.87 ID:/tcXdUh0
渾身のスペシャルx265で再テスト。
スペシャルって言っても、単にPGOビルドしただk

元は>>152
PGO版もビルドバージョンは合わせて2.1+70(x64)
2K
付属>>152からコピペ
【Veryfast】 61.77 fps
【. Medium】 29.58 fps
【   Slow】 12.51 fps

自前PGOビルド
【Veryfast】 65.80 fps +6.5%
【. Medium】 31.83 fps +7.6%
【   Slow】 13.12 fps +4.9%

4K
付属
【Veryfast】 16.83 fps
【. Medium】 7.11 fps
【   Slow】 3.13 fps

自前PGOビルド
【Veryfast】 17.61 fps +4.6%
【. Medium】 7.70 fps +8.3%
【   Slow】 3.29 fps +5.1%

確実に効果はある、あるんだが・・・平均6%改善として、
60分エンコが57分弱になるだけなんだよな。。。
でも、CPUクロックで5%稼ごうとするとさらに+200MHz以上盛らないとだから、
その差は小さいわけでも無いんだが。

208 :Socket774:2016/12/25(日) 00:21:23.03 ID:/7ruLk78
>>207
PGOビルドするだけだけでそんな速くなるのか
一般にx264/x265は速度必要な部分は全てアセンブラコード
になってるからどうやってコンパイルしても速度がほとんど変わらない
みたいなのが定説だっただけに驚き
バイナリサイズどれくらいになる?

209 :Socket774:2016/12/25(日) 00:26:23.43 ID:PZbtkyiR
なる
そうやって%で見ると意外と大きい割合なのね

210 :Socket774:2016/12/25(日) 01:09:17.10 ID:/tcXdUh0
>>208
このPGOビルド版、12bitは除いてるんで8bit+10bitでの比較だが、
LTCG版 6.77 MB (7,107,584 バイト)
PGO版  6.63 MB (6,962,176 バイト)
こんな感じ。
最適化が効いてるのは、ループと条件分岐、後はキャッシュの使い方あたりか。
PGOって結局実際に動かして、よく使われる・使われない部分の頻度、条件分岐確立とか記録して、
使用頻度が低い部分を遅くしてでも、よく使われる部分を速く処理出来る様に最適化するから。

だから、当然PGOの場合、最適化用に食わせた設定・データによって、
最適化そのものが変わるんで、実用の場面では、自分の使う設定・データを元にしないと、
効果が出にくい事もあるかと。
まぁ、相当特殊な映像やオプション使わない限り、実写系とアニメ系をちょろっと食わせとけば、
大抵LTCG版より速くはなると思うけど。

今回のはベンチの設定+ベンチに付属の動画をそのまま食わせてる。
さすがに4kは全部食わせると、べらぼうに時間かかるんで、先頭の200フレ位しか使って無いが。
まぁそれがスペシャルの所以なんだけど。

211 :Socket774:2016/12/25(日) 05:06:48.54 ID:ak+ziLkV
CUDAの10bit/h265エンコまじで画質いいな
たまにタブやスマホで再生できないファイルが出来る問題さえクリアすれば
もうソフトエンコいらないかも

212 :Socket774:2016/12/25(日) 07:19:48.64 ID:1l9FvRMg
>>208
x264でもfprofiledするかどうかで3~5%ぐらい速度に差が出ることもあるぞ
大体のビルダーはやってると思う

213 :Socket774:2016/12/25(日) 09:41:18.31 ID:PZbtkyiR
しかりriagaya氏のもPGOを有効にしてビルドしてくれてるのに
>207の伸び率だから自環境で行うのが重要なんでは?

>>210
「ベンチに付属の動画」をソースにとのことだけど、x265にどうやって食わせてるの?
ベンチと同じくffmpeg経由?

214 :Socket774:2016/12/25(日) 10:02:24.00 ID:bWZhpJ/H
>>211
どのソフトでエンコしたのか良かったら教えて欲しい

215 :Socket774:2016/12/25(日) 10:38:21.30 ID:bWZhpJ/H
自分の使ってるグラボじゃダメなようです
お騒がせしました

216 :Socket774:2016/12/25(日) 11:06:58.80 ID:7H+OC5/h
>>213
ああ、>>101同梱のrigaya氏がコンパイルしたx265.exeも既にPGOビルドされてるのか

217 :Socket774:2016/12/25(日) 12:41:11.17 ID:U4HD2P+Q
モバイル用はまだ264で良いだろ
負荷高いとバッテリーきついし 保存用に

218 :Socket774:2016/12/25(日) 12:49:03.55 ID:Z6hYE7j+
最近のならHWデコーダついてるから変わらんだろ
1分でもバッテリーライフ長くとかならわからんが

219 :Socket774:2016/12/25(日) 13:17:54.65 ID:H0cRHBXr
>>217
むしろ、モバイル端末でのストリーミング再生用にこそ高圧縮率な動画規格が必要とされているんだがな
DoCoMoのdアニメストアとかは2年以上も前からH.265(HEVC)に対応開始しているし、最近のスマホは軒並みハードウェアデコードに対応している

220 :Socket774:2016/12/25(日) 14:32:21.90 ID:/tcXdUh0
>>213,216
あれ、rigaya氏が配布してるx265は現状、LTCG版だった気がするが・・・
最近確認してないけど、12bitのロジックがVSのPGOビルドするとぶっ壊れるので。
問題が直っていない&12bit処理まで含まれているビルドなら、恐らくPGOビルドしてない。
自分が12bit除いてPGO使ってるのも、上記問題があるからだし。
(そもそも使わないから、無くても問題ない)

ベンチ付属の動画をffmpegでy4mに変換したファイルを別に用意して食わせた。
実質、やってることはベンチと同じだな。

221 :Socket774:2016/12/25(日) 14:36:56.44 ID:PZbtkyiR
中身は知らないけど今も二種類用意されてるはず
rigayaさんが公開してくれてる自動ビルドバッチもpgo最適化ありだから
12bitまで含めてる非PGOのものと10bitまでのPGO版なのかもね

222 :Socket774:2016/12/25(日) 15:56:35.18 ID:U4HD2P+Q
ソフトエンコより確実に20倍は早いnvenc これからどんどん画質良く最適化されて将来性あるよなー
cudaの時は糞だったけど

223 :Socket774:2016/12/25(日) 16:03:03.10 ID:U4HD2P+Q
スマホとかタブでも265の再生支援が来ればすぐ普及だろうけど
あとtube

224 :Socket774:2016/12/25(日) 16:07:14.67 ID:v4fxPlmo
スマホタブは、もう何年も前からH265のハードデコードに対応してた気がするが

225 :Socket774:2016/12/25(日) 16:12:37.60 ID:U4HD2P+Q
アイフォンはしてたと思うけど
アンドロイドの低価格機とかだときついだろ ローエンドまで普通になればって事ねw

226 :Socket774:2016/12/25(日) 16:13:45.59 ID:KpTf3GeZ
使用料とかライセンスの問題でゴタゴタしてるのがネックなのでは

227 :Socket774:2016/12/25(日) 17:11:31.50 ID:H0cRHBXr
>>225
Androidの格安スマホでもHEVCのHWデコード対応しているが

税込 15,984円では高いか?
https://simseller.goo.ne.jp/category/ASUS/00002MAX16PRMOR_SIMSET.html

228 :Socket774:2016/12/25(日) 17:55:41.11 ID:U4HD2P+Q
>>227
それでかくつかずいけるんかね CPUショボそうだけど

229 :Socket774:2016/12/25(日) 18:05:07.29 ID:uFzZbr5k
S410のHEVCは720pまでだな

230 :Socket774:2016/12/25(日) 18:14:53.11 ID:ajVoLdCi
そんなしよぼいものでもしよぼいものが入ってる時代ってことか

231 :Socket774:2016/12/25(日) 18:42:35.62 ID:H0cRHBXr
>>228
そのためのハードウェアデコーダだぞ

232 :Socket774:2016/12/25(日) 18:57:25.10 ID:1l9FvRMg
>>220
リアルタイムでデコード処理が入らない分x265のエンコ速度は多少上がると思う

233 :Socket774:2016/12/25(日) 19:06:11.90 ID:qBgsABoC
ハードウェアデコーダの性能がまとまって載ってるサイトとかないですかね。

234 :Socket774:2016/12/25(日) 20:47:43.95 ID:UJzNIcrM
>>233
まとまってるわけじゃないが、こういうスレならある。

 Evaluation of HEVC decoders (SW, Hybrid and HW) - Doom9's Forum
 http://forum.doom9.org/showthread.php?p=1694697

235 :Socket774:2016/12/25(日) 21:10:27.48 ID:U4HD2P+Q
誰かスナドラ400とかのローエンドで265再生してみてよw

236 :Socket774:2016/12/25(日) 21:30:33.88 ID:kTiKLdx2
砂銅鑼410、当たりファイルは余裕で再生できる
外れファイルは音だけだったり再生自体が不能だったり
ハードウェア支援なので、バッテリを特段消費することもない

237 :Socket774:2016/12/26(月) 02:44:30.99 ID:7QgEJSfJ
ちなみに、800は公式サイトにはサポート表記ないけど
MXPlayerとかだと普通にHW再生出来る

238 :Socket774:2016/12/26(月) 04:05:31.10 ID:4M7cmAYl
このスレのお陰でHaswell以降なら
今のx265は意外と速度が出ること分かって
試しにx265guiEx使ってx265試験エンコ始めてみた(rigaya氏さま様)
1280*720pでmidiumだと50fpsくらい出るのな
この速度なら十分だわ

239 :Socket774:2016/12/26(月) 14:05:53.13 ID:SNW0EZQQ
>>238
50もでたらええな 十分実用過ぎる

240 :Socket774:2016/12/27(火) 02:33:57.35 ID:aDeTVx9a
【CPU】Core i5-4690K@定格(エンコ時3.9GHz)
【MEM】DDR3-2400-8GB x2(11-13-13-31 2T)
【M/B】Z97-PRO GAMER Rev. 1.0 BIOS:2203
【GPU】Intel HD Graphics 4600(iGPU)@定格 *OpenCL不可
【HDD】M.2 SSD 256GB(PCIEx2)
【OS】10P64 AU

【x264】r2334 (x64/x86) 8bit
【Veryfast】56.14 / 51.13
【. Medium】14.93 / 13.02
【   Slow】7.02 / 6.34
【. Slower】3.41 / 2.74

241 :Socket774:2016/12/27(火) 02:36:02.09 ID:aDeTVx9a
【x264】r2579 (x64/x86) 8bit
【Veryfast】56.44 / 49.78
【. Medium】14.89 / 12.78
【   Slow】7.04 / 6.24
【. Slower】3.41 / 2.71

【x264】r2665 (x64/x86) 8bit
【Veryfast】56.58 / 51.17
【. Medium】14.94 / 13.07
【   Slow】7.05 / 6.31
【. Slower】3.41 / 2.73

解体前にねっとりベンチ計測
エンコ中の消費電力は93-95w
エンコ時にクロックがTB上限の3.9GHzに張り付いていたのはさすがDevil's Canyonというべきか

……いつのまにかx265がトレンドになってるのな

242 :Socket774:2016/12/27(火) 03:02:00.96 ID:N5sL2szG
使ってるのはまだx264だけど
ベンチしてはx265も面白いなと思って
x264はだいたい傾向分かったし

243 :Socket774:2016/12/27(火) 15:56:10.36 ID:JJU04jop
x265最新コミットで2パスエンコードの速度が向上した模様
2パスエンコの需要は微妙っぽいが更新は嬉しい

244 :Socket774:2016/12/27(火) 16:19:40.78 ID:GsEGg8Kc
ハス i5で14.5FPS ミディアム
265と大して変わんないな もう265で良いか

245 :Socket774:2016/12/27(火) 16:59:21.30 ID:GsEGg8Kc
>>243
べんchしてみてよ

246 :Socket774:2016/12/27(火) 18:28:46.04 ID:Nq3FaduV
>>238
だけど、x265試験導入の段階では確かに最新x265ならmediumだと結構速いんだけど
長年、自分で秘伝のタレのように熟成させてきたx264の設定と
比べるとサイズ・画質・速度でほとん優位がないわ(速度は当然x264優位)
x265でも設定を熟成させてかないとならんな

247 :Socket774:2016/12/27(火) 18:39:58.95 ID:LFvmG6bY
265はNVEncがすごいわ
速度も画質も264のCPUエンコ以上

248 :Socket774:2016/12/27(火) 18:41:55.19 ID:nx5P7xS1
>>246
自分が使いこなせてないだけじゃん

249 :Socket774:2016/12/27(火) 18:45:46.33 ID:vfpB8e0O
圧縮率を高く評価しないとx264より優位性は薄くなる
x264で高画質にエンコするならそれでいいわけだし

250 :Socket774:2016/12/27(火) 18:57:26.72 ID:nx5P7xS1
ちょっと何言ってるか分かんない

251 :Socket774:2016/12/27(火) 18:58:38.12 ID:7ICQswOi
>>102だけど、上でPGOビルドの話が出てたので
rigaya先生のところ↓からPGOビルドの方を頂いて、通常ビルドと差し替えて比較してみた
https://onedrive.live.com/?authkey=%21AJWOVN55IpaFffo&id=6BDD4375AC8933C6%213306&cid=6BDD4375AC8933C6

x265_Benchmark

【CPU】i7-4770(定格)
【MEM】DDR3-1600 4GBx2
【M/B】ASUS H87M-Pro
【SSD】Crucial M550
【OS】 Win7 x64 Pro
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【x265】2.1+70 x64 → 2.1+71 x64 (PGOビルド)

【Veryfast】 29.15 fps → 30.15 fps (+3.4%)
【. Medium】 14.54 fps → 15.52 fps (+6.7%)
【   Slow】 5.98 fps → 6.26 fps (+4.7%)

自前環境向けにPGOビルドしたものでなくても結構効くもんだね

204 KB
新着レスの表示

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)