5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

【x264+Avisynth】実用エンコベンチ Part5.1 [無断転載禁止]©2ch.net

1 :Socket774:2016/04/07(木) 21:34:26.34 ID:zcrOJ+Cg
x264ベンチ報告スレです。

ベンチマークセットはここ
https://drive.google.com/file/d/0B8Fsw9b9NGgXS05ibE9RZUExQTg/edit?usp=sharing

構成はこんな感じで
【CPU】
【MEM】
【M/B】
【GPU】
【SSD/HDD】
【OS】
【x264】

前スレ
【x264+Avisynth】実用エンコベンチ Part4
http://potato.2ch.net/test/read.cgi/jisaku/1397956056/

128 :Socket774:2016/12/21(水) 00:38:39.70 ID:bBYxkQrp
>>124
マジか・・結構な差になるんだな
さすがにSS2止まりなのが原因だろうか

129 :Socket774:2016/12/21(水) 00:42:16.05 ID:bBYxkQrp
>>127
めんご
メモリ帯域はあんまり関係ないみたいだ・・

130 :Socket774:2016/12/21(水) 00:46:41.14 ID:dFDHW+D/
さっそく>>102からメモリ帯域半殺しで計測してみた

【CPU】i7-4770(定格)
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【MEM】DDR3-1600 4GBx2 → DDR3-1600 4GBx1(シングルチャネル)

【Veryfast】 29.15 fps → 27.09 fps (-7%)
【. Medium】 14.54 fps → 14.10 fps (-3%)
【   Slow】 5.98 fps  →  5.90fps  (-1.3%)

x264と同様にあんまり差がなかった

131 :Socket774:2016/12/21(水) 00:54:22.49 ID:dFDHW+D/
>>126
Broadwell-E 10C20Tすご過ぎワロタw

132 :Socket774:2016/12/21(水) 01:07:02.09 ID:HWW+vDiz
5960Xのついでに980Xでも試してみた

【CPU】i7-980X@定格(定格3.33GHz/TB 6C時最大3.46GHz)
【MEM】DDR3-1600 8GB x 3
【M/B】ASUS P6T
【SSD】Crucial C300 256MB
【OS】 Windows7 Ultimate 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 17.86 fps
【. Medium】 9.78 fps
【   Slow】 4.25 fps

>>125
Sandy Bridge-Eのメモリーチャンネル半減でx264エンコードが数%程度しか変わらなかったという記事を昔見たよ

133 :Socket774:2016/12/21(水) 02:02:57.72 ID:1hXJAFS5
>>124
PhenomII X6 1100T@3.8GHzって
未だにx264ならHaswell i7の7割くらいまで頑張れるのにな

134 :102:2016/12/21(水) 06:50:36.17 ID:we2Wqsgj
更にx265で拡張命令がどう効いてる詳細に調べてみた

x265_Benchmark

【CPU】i7-4770(定格)
【x265】2.1+70 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】 29.15 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】 28.81 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】 21.60 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】 21.43 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1
【Veryfast】 21.83 fps

【拡張命令】 MMX2 SSE2Fast SSSE3
【Veryfast】 8.61 fps

【拡張命令】 MMX2 SSE2
【Veryfast】 6.81 fps

【拡張命令】 MMX2
【Veryfast】 4.08 fps

【拡張命令】 none!
【Veryfast】 4.07 fps

135 :Socket774:2016/12/21(水) 06:55:18.67 ID:we2Wqsgj
比較対象としてx264の時の拡張命令の効き具合

【CPU】i7-4770(定格)
【x264】 r2377 x64 

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【.Veryfast.】 61.90 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【.Veryfast.】 61.64 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【.Veryfast.】 60.22 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【.Veryfast.】 59.26 fps

【拡張命令】 MMX2 SSE2Fast SSSE3
【.Veryfast.】 58.93 fps

【拡張命令】 MMX2 SSE2Fast
【.Veryfast.】 55.82 fps

【拡張命令】 MMX2
【.Veryfast.】 34.66 fps

【拡張命令】 none!
【.Veryfast.】 10.50 fps

136 :Socket774:2016/12/21(水) 06:56:50.39 ID:XkjFPj9/
>>134
MediumとSlowでも上5つの設定だけでいいんでやってみてください
お願いします

137 :Socket774:2016/12/21(水) 07:02:20.34 ID:we2Wqsgj
>>124
x264だと今でもそれなりの速度が出たPhenomII X6 1100Tあたりが
x265だと何でこんなに速度出ないかってのがよくわかる

x264だとSSE2、MMX2に思いっきり最適化されてるのに対して
x265だとSSE2にはあまり最適化されてなくて、MMX2に関してはほぼ最適化されてない
そしてAVX2と並んでSSE4.1への最適化が大きくて
SSE4.1に対応してないK10だと美味しい拡張命令がほとんど使えないようだ

138 :Socket774:2016/12/21(水) 07:07:37.11 ID:we2Wqsgj
>>136
他の人の例にもあるようにAVXとSSE4のうちSSE4.2で新規追加された分の命令は
ほとんど効いてないようなので、>>102-103の比較で十分だと思うけど、どうかな

139 :Socket774:2016/12/21(水) 08:14:19.86 ID:eocCKyAU
x264が世に出たのは2004年6月でPentium4とAthlon64の時代で
まだ使える整数演算の拡張命令がMMX2とSSE2しかなかったから
ひたすらこの2つに最適化させるしかなかった
一方でx265の安定版が世に出たのは2012年9月でHaswellが発売された
後だから既にAVX2があった頃

140 :Socket774:2016/12/21(水) 08:15:51.45 ID:eocCKyAU
あっ間違った
x265の初出が2013年で安定版リリースがやっと今年の9月だった

141 :112:2016/12/21(水) 08:40:32.88 ID:Ar3a0iIo
ありあわせのFANに交換して情報追加
HTの効率はx264に比べて若干低め?

【CPU】i5 4690K
【MEM】DDR3 8GBx2
【M/B】Z97M-Pro4
【HDD】WD Blue 3TB
【SSD】Crucial M550
【OS】 Win10 64bit home Anniversary
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

3.7/1600
【Veryfast】 24.27fps
【. Medium】 12.74fps

3.7/2133
【Veryfast】 24.69fps
【. Medium】 12.90fps

3.9/1600
【Veryfast】 25.18fps
【. Medium】 13.36fps

3.9/2133
【Veryfast】 26.06fps
【. Medium】 13.45fps

4.5/2133
【Veryfast】 29.66fps
【. Medium】 15.51fps

142 :Socket774:2016/12/21(水) 09:02:53.51 ID:9MBSfvQZ
HTの効率がx264に比べて若干低めって言うよりも
1スレッド分のコア使用度が高い感じ
x264の時は4C8TのCPUの場合はデフォ12thread走らせてるけど
それでも普通にネットしたり動画見れたりするけど
x265だとデフォできっちり8threadだけしか走らせてないけど
それでもうマウスカーソルがカクつくくらい処理能力使いきてっるのな

143 :Socket774:2016/12/21(水) 09:52:21.74 ID:bBYxkQrp
>>139
でもそれから13年も経とうかというのにSSE2止まりなのは
命令への最適化じゃなくコーデック規格自体がSSE2世代向けなんでは?
そこにいくとHEVCはGPGPUなどヘテロジニアス・プロセッシングも考慮に入れて策定されてるから
まだまだ伸びしろも十分ある・・のかもしれない

144 :Socket774:2016/12/21(水) 10:52:21.06 ID:TqyBZzVA
もうAVX2とかないのは使う気にならないな
電気の無駄だわ

145 :106:2016/12/21(水) 11:59:38.02 ID:vDy61RSB
>>106をやった限りだと
AVX2ぶん回した感想だと、それなりに負荷の高いゲームをやっているときより+10度くらいコア温度が高かったんで
消費電力を測ったわけじゃないが、結構電気も食ってそうだったぜ

146 :Socket774:2016/12/21(水) 12:02:22.91 ID:TqyBZzVA
occt AVXと同じ負荷かかってんだろうな

147 :Socket774:2016/12/21(水) 15:46:54.37 ID:MJYnUw5Z
>>141
意外とメモリクロックは効くね
もっと誤差レベルかと思ってた

148 :Socket774:2016/12/21(水) 15:57:11.12 ID:POkMsiTM
>>143
x264も数年前からSSE2用以前のアセンブラコードにはほとん手が入ってないと思う
それでも10年近く地道にSSE2、MMX2に最適化してきた
アセンブラコードの改良の積み重ねは伊達じゃない
一方でx265はSSSE3以前しか使えない環境に対する
アセンブラコードなんてまともに開発して意味がある時代じゃなくなってるからな

149 :Socket774:2016/12/21(水) 16:16:47.80 ID:POkMsiTM
x265の開発が本格化した2013年の時点では
AVX2を使えるCPUとSSE4まで使えるCPUの2つだけに
アセンブラ最適化のターゲットしぼれば開発リソースの節約になって
SSE4は使えないけどSSE4aなら使えるというニッチなCPUが
K10しかなかったからSSE4が使えないK10は切り捨てられたんだろうな

150 :Socket774:2016/12/21(水) 18:11:09.57 ID:CwDOCZOb
x264もK10に対してはここ4年ほどで

MMX2 SSE2Fast FastShuffle SSEMisalign LZCNT
      ↓
MMX2 SSE2Fast SSEMisalign LZCNT
      ↓  
MMX2 SSE2Fast LZCNT

と、使用されてる拡張命令がコードから次々とリストラされてるようだ

151 :Socket774:2016/12/21(水) 18:57:15.49 ID:bBYxkQrp
>>148
AVX化で数パーセントでも時間短縮できるなら
どこかの暇なギークがせっせとコミットするだろうけど、
実際そうじゃないのは団子が言うように根本的に向いてないんだろうな

152 :Socket774:2016/12/21(水) 19:15:56.45 ID:Lc7Nyxx2
俺もやってみた。
消費電力除けば、BroとHasのコア性能はそんなに変わらないという、
当たり前の結果に。

【CPU】i7-5960X@4.3GHz
【MEM】DDR4-2400 4GB x 4
【M/B】ASUS X99-DELUXE
【SSD】Intel 750 400GB
【OS】 Win10 pro 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 61.77 fps
【. Medium】 29.58 fps
【   Slow】 12.51 fps

>>151
結局H264/H265どちらも、整数演算しか使わないので、
浮動小数点のみのAVXじゃ、ロード・ストア系除く命令は使い道が無いってだけじゃ。

153 :Socket774:2016/12/21(水) 20:07:15.04 ID:bBYxkQrp
話の筋的にはAVX2も含む

154 :Socket774:2016/12/21(水) 21:48:35.03 ID:CsQENohl
Bloomfieldでもやってみた。世代の割には頑張るね。
ただこのクロックだとFX-8350より熱いw

x265 Benchmark

【CPU】 i7-930(3.8GHz Uncore3.2GHz)
【MEM】 DDR3-1600 4GBx6
【M/B】 GA-X58A-UD7 rev1.0
【SSD】 HDS722020ALA330
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 17.40 fps
【. Medium】 9.30 fps
【  Slow】 3.94 fps

155 :Socket774:2016/12/21(水) 23:10:29.98 ID:HWW+vDiz
5960Xと980XのついでにQ9650でも試してみた

【CPU】Core2 Quad Q9650@3.6GHz
【MEM】DDR2-1066 2GB x 2
【M/B】ASUS P5Q-E
【SSD】Crucial BX100 250GB
【OS】 Windows10 Home 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1

【Veryfast】 9.04 fps
【. Medium】 4.98 fps
【   Slow】 2.00 fps

156 :Socket774:2016/12/21(水) 23:17:29.36 ID:VBi+RUO3
>>124
>>155
x264だとコア数の差がそのまま出て1.5倍ほど速いであろう
PhenomII X6 1100T@3.8GHzが、x265だと
逆に1.5倍差付けられて負けてるところが興味深いな

157 :Socket774:2016/12/21(水) 23:31:53.76 ID:ascnGhxd
【CPU】i7-4702MQ(Haswell)
【MEM】DDR3 8GB
【GPU】Intel HD4600
【OS】Win10 Anniversary Home x64
【x265】2.1+70(x64)

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】21.72 fps
【 Medium】11.08 fps
【   Slow】 4.44 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】21.38 fps
【 Medium】10.92 fps
【   Slow】 4.30 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】16.57 fps
【 Medium】 8.77 fps
【   Slow】 3.72 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】16.31 fps
【 Medium】 8.53 fps
【   Slow】 3.65 fps

158 :Socket774:2016/12/22(木) 08:33:07.18 ID:iGZiIH1t
x265_Benchmark

【CPU】Xeon E5 2650L v3 定格 HT 無効/TB 有効
【MEM】DDR4-2133 16GB x4
【M/B】ASRockRack EPC612D4i
【SSD】Crutial CT250MX200SSD1
【OS】 Windows Server 2012 R2 Update
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 35.40 fps
【. Medium】 18.32 fps
【   Slow】 7.35 fps

12c 2.1Ghz じゃそこまで早くはならないぽ

159 :Socket774:2016/12/22(木) 09:01:39.77 ID:FwjGpy84
x265 Benchmark

【CPU】 i7-3930k@4.0GHz
【MEM】 DDR3-1866 4GBx4
【M/B】 X79 Professional
【SSD】 Crucial MX100 512GB
【OS】 Windows7Pro x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX

【Veryfast】 26.61 fps
【. Medium】 14.87 fps
【  Slow】 6.44 fps

160 :Socket774:2016/12/22(木) 12:27:48.82 ID:35fahdgU
x265

i5 6600 定格
ddr4 2133 x2
h110m hdv
ssd seagete 600 240GB

slow 5.7 fps

161 :Socket774:2016/12/22(木) 12:30:09.32 ID:35fahdgU
i7 4770 に近いぐらいのスピード出ててびっくり
h265は skylake 有利だね

162 :Socket774:2016/12/22(木) 13:46:35.85 ID:1qTSMMqR
E5 2650L v3 なら >>108 と同じくらいの CPU クロック合計なのに速度出ないの残念だ…

163 :Socket774:2016/12/22(木) 15:33:25.79 ID:RzAAUxH9
x265でスレが盛り上がっていいぞ〜

164 :Socket774:2016/12/22(木) 18:15:58.62 ID:P48w/RJH
>>119だけど、K10の切り捨てられっぷりが話題になってたので
更に無謀にも --no-asm でもやってたみ

265_Benchmark

【CPU】AthlonII X2 240e
【MEM】DDR3-1600 2GBx2
【M/B】MSI 880GM-E41
【SSD】Plextor PX-256M5S
【OS】 Win10 Poe x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast LZCNT
【Veryfast】 1.52 fps
    ↓
【拡張命令】 none!
【Veryfast】 0.89 fps

K10はアセンブラコード無しと有りで1.7倍しか変わらない

一方でx264と同じような比較してみると
【x264】r2334 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSEMisalign LZCNT
【Veryfast】 10.90 fps
    ↓
【拡張命令】 none!
【Veryfast】 2.03 fps

って感じで5倍差が出てる
>>134のi7-4770みたいに7倍とはいかなくても
4倍差くらいあったら>>124の1100Tあたりはまだ頑張れそうなのに

165 :Socket774:2016/12/22(木) 18:56:24.90 ID:CsnhnEI/
K10向けにカリカリに最適化してもそんな伸びないよ
アムドの拡張命令実装は大概「とりあえず動く」レベルであって、性能が出るレベルじゃない
ZenもAVXがDoublePath、BMIはVectorPathなんて仕様だから、あんま期待しない方がいい
純スカラ整数コードならイッテルの4Cは軽く蹴散らし、うまくすると6Cとも張り合えるだろうが
エンコだと4Cにも勝てるかどうか怪しい

166 :Socket774:2016/12/22(木) 19:34:13.07 ID:QCBwn+5y
田村は他でやってね

167 :Socket774:2016/12/22(木) 20:21:21.95 ID:8o8dpJYf
DTVやソフ板なら宗教戦争持ち込むなハゲ、の一言で済むけどここ自作PC板なんだよな
ま、コアの性能自体は置いといて、エンコは基本マルチコア化が超有効だから4コアに負けることは無いはず
例えばIntelでのx265はAVX2の有無で30%の性能差があるが、コア数が倍になれば所要時間はほぼ半分になるし

168 :Socket774:2016/12/22(木) 20:26:07.58 ID:Gbl4UwPE
そうか?

169 :Socket774:2016/12/22(木) 20:29:05.06 ID:KQ/lkdvF
8コアでもイソテル4コアに負けるのがAMD

170 :Socket774:2016/12/22(木) 20:35:39.25 ID:8o8dpJYf
実のところBulldozer(モジュール)は2スレッド実行できる1コアだよ
>167の書き方が悪いんだけど、最後の段落はIntelにも当てはまるのは分かるでしょ

171 :Socket774:2016/12/22(木) 22:49:43.88 ID:+kc8Fkcq
自作ではないけど比較用に。2C2Tではこんなものかな

x265 Benchmark

【CPU】 Celeron N2820(2.4GHz)
【MEM】 DDR3-1333 2GBx2
【M/B】 DN2820FYKH
【SSD】 SanDisk Extreme PRO 480GB
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 1.82 fps
【. Medium】 0.96 fps
【   Slow】 0.42 fps

172 :Socket774:2016/12/23(金) 00:16:06.63 ID:K3WuwBFD
やっと265の時代か 

173 :Socket774:2016/12/23(金) 00:58:48.34 ID:mdrOl6nv
x264も大分変わったからまたやらないといけないな

174 :Socket774:2016/12/23(金) 04:45:27.17 ID:4ULyquge
エンコの宝刀・AVX2はcoreシリーズだけの装備なのか…

175 :102:2016/12/23(金) 09:08:02.44 ID:/VJqy3uU
>>141
> HTの効率はx264に比べて若干低め?

HTの効果の度合いをx265とx264で比較してみた

【CPU】i7-4770(定格:エンコ中全コア3.7GHz)
【MEM】DDR3-1600 4GBx2
【M/B】ASUS H87M-Pro
【SSD】Plextor PX-M5S
【OS】 Win7 x64 Pro
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

  HT無し(4C4T)  →  HT有り(4C8T)

【x265】2.1+70 (x64)
【Veryfast】 24.76 fps → 29.15 fps (+17.7%)
【. Medium】 12.82 fps → 14.54 fps (+13.4%)
【   Slow】 5.38 fps → 5.98 fps (+11.2%)


【x264】r2638 (x64)
【Veryfast】 52.33 fps → 62.30 fps (+19.1%)
【. Medium】 14.01 fps → 16.71 fps (+19.3%)
【   Slow】 6.64 fps → 7.62 fps (+14.8%)


推察の通りにx264に比べると、x265はHTの優位性は少し低いね

176 :Socket774:2016/12/23(金) 10:04:55.00 ID:z7gvtvVC
i5とi7だと4割近く上がってるはずだけど(x264で)それどうやってON/OFFで計測したの?
エンコーダー側のスレッド数を変えた感じ?

177 :Socket774:2016/12/23(金) 10:25:57.59 ID:/VJqy3uU
マザーのUEFIでHTT有効/無効が切り替えられる

178 :Socket774:2016/12/23(金) 10:28:02.13 ID:/VJqy3uU
それと、同クロックでさすがにHTTの有無では4割も差は出てないよ
過去のこのスレの数々の結果かから見ても

179 :Socket774:2016/12/23(金) 10:52:38.06 ID:z7gvtvVC
そうなの?
価格.comの掲示板で4割近く上がるからi7絶対おすすめって書かれてたから
そうなのかと思ってた

180 :Socket774:2016/12/23(金) 10:55:03.86 ID:K3WuwBFD
sky傾向なら十分実用的になったな

181 :Socket774:2016/12/23(金) 11:19:43.98 ID:K3WuwBFD
ここ見ててマザーで切り替えられるの知らないとかネタだろwwwさすがに

182 :Socket774:2016/12/23(金) 11:57:01.35 ID:/QeKjCI0
【CPU】i7 6950X@4.35GHz(127.9*34), Cache@3.71GHz
【MEM】G.Skill F4-3400C16Q-16GRBD@DDR4-3410 16-18-18-38 1T
【M/B】ASUS Rampage V Extreme
【SSD】SanDisk Extreme PRO 480GB
【OS】 Windows7 Pro 64bit SP1
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 75.87 fps
【. Medium】 37.02 fps
【.  Slow】 15.07 fps


あとベンチ用の元動画を適当に4K(3840x2160)にリサイズ、再エンコして4Kで測定できるようにしてみた

x265_Benchmark_4K対応版
https://1drv.ms/u/s!Akfj_vsVPKU9gjcuOu3swPN98u-7

x265_Benchmark_3840

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 20.84 fps
【. Medium】 9.18 fps
【.  Slow】 4.08 fps

183 :182:2016/12/23(金) 12:28:22.64 ID:/QeKjCI0
OneDriveのURLがInvalid URIになってしまうようなので
https://drive.google.com/file/d/0B8o-zISICm3lRXg4dTdaVnBOWkk/view?usp=sharing

184 :Socket774:2016/12/23(金) 13:08:22.69 ID:eqByT/Ck
6950Xといえども流石に4KではMedium 10fps超えは無理か

185 :Socket774:2016/12/23(金) 13:13:59.44 ID:K36congF
2万3万円の普通に売っているCPUで、4kをまともな速度でエンコできるようになるには
もう3回か4回くらいシュリンクやアーキテクチャ変更が必要じゃねえ

186 :Socket774:2016/12/23(金) 13:28:20.93 ID:4CPAJTU4
あと2,3世代で頭打ちと言われてる

187 :182:2016/12/23(金) 14:04:53.36 ID:/QeKjCI0
--pools 64 --frame-threads 16 オプションつけたらCPU使用率が上がって若干早くなった

x265_Benchmark(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 83.50 fps
【. Medium】 38.88 fps
【.  Slow】 15.80 fps

x265_Benchmark_3840(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 21.69 fps
【. Medium】 9.73 fps
【.  Slow】 4.23 fps

4KだとMedium以上でCPUほぼ100%使い切るようになった

188 :Socket774:2016/12/23(金) 14:43:46.27 ID:K3WuwBFD
>>185
10コアぐらいが普通にならないときついんかね

189 :Socket774:2016/12/23(金) 14:45:38.14 ID:K3WuwBFD
fhdの265で もうかなり満足な画質だけどねえ

190 :Socket774:2016/12/23(金) 14:59:57.65 ID:qFQdMT4m
そもそもx265がまだ未成熟だというのを忘れてはいけない
今年も速度が向上したり機能が追加されたりしている

191 :Socket774:2016/12/23(金) 15:44:13.37 ID:z7gvtvVC
現状から劇的に上がるのかねぇ
今の停滞が次のジャンプのための準備期間だったらいいんだが

192 :Socket774:2016/12/23(金) 15:53:56.41 ID:rdeNfqjo
停滞してるなんて思わないなあ
まあもっと軽くはなって欲しいけど

193 :Socket774:2016/12/24(土) 01:57:46.76 ID:Uu3jzn1g
HTTの利点は、よりフルロードに貼り付けやすくするだけだから
過多スレッドでブン回して100%に貼り付けたら同クロック動作の4Cなi7とi5ならキャッシュの差しか無い
逆に100%張り付かないエンコーダやベンチ、ゲームなんかではCPUロードが稼ぎやすくTurboBoostのクロックも高く推移させやすくなるから重宝されるし価値がある

194 :Socket774:2016/12/24(土) 07:38:31.79 ID:LEOxNhyp
        ____
        /     \
     /   ⌒  ⌒ \   何言ってんだこいつ
   /    (●)  (●) \
    |   、” ゙)(__人__)”  )    ___________
   \      。` ⌒゚:j´ ,/ j゙~~| | |             |
__/          \  |__| | |             |
| | /   ,              \n||  | |             |
| | /   /         r.  ( こ) | |             |
| | | ⌒ ーnnn        |\ (⊆ソ .|_|___________|
 ̄ \__、(“二) ̄ ̄ ̄ ̄ ̄l二二l二二  _|_|__|_

195 :Socket774:2016/12/24(土) 08:36:34.57 ID:3bIdIGKY
このベンチは4C4Tでやっても8C8Tでやっても
同じく100%付近に張り付いたまま>>175の差が出るってことを
知らずに書いてるのは間違いない

196 :Socket774:2016/12/24(土) 08:37:00.30 ID:3bIdIGKY
8C8Tじゃなくて4C8Tだ

197 :Socket774:2016/12/24(土) 13:19:49.00 ID:Nag5DyNj
【CPU】i7-6700(全コア3.7GHz -offset0.16V)
【MEM】DDR4-2133 8GB x 4
【M/B】ASUS Z170M-PLUS
【SSD】CT960M500
【OS】 Win7 Pro x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 34.14 fps
【. Medium】 16.87 fps
【   Slow】 6.83 fps

アイドル 26W、x265エンコ 75W、x264エンコ 75W、OCCT LINPAK 88W、Prime95v2810 96W
同じソースを使ってGTX1050Ti NVEncC CQPエンコ時max84W
HEVC 246.94fps、HEVC 10bit 255.03fps、HEVC YUV444 10bit 153.39fps

198 :Socket774:2016/12/24(土) 14:12:46.64 ID:XtzQctDZ
NVEncはさすがに品質が糞すぎるのでせめてQSVのICQと比べておくれ

199 :Socket774:2016/12/24(土) 17:03:28.62 ID:2qDLwNHB
>>197
やっぱりSkylakeはx265大得意だな

200 :Socket774:2016/12/24(土) 17:27:59.97 ID:EkX2J8zn
>>199

>A key improvement in Skylake is the internal ring bus, which has double the memory bandwidth of the previous CPU generation (Haswell/Broadwell).
>The internal ring moves data inside the CPU, from cache memory to logic units in each core, and back again.
>Our performance profiling shows that x265 performance is often constrained by the memory bandwidth of Haswell generation cores which is about 20 GB/sec.
>Skylake cores have about 40 GB/sec bandwidth, removing this bottleneck.

>For 4K encoding on a quad-core desktop, we see a memory bandwidth bottleneck on Haswell processors with our fastest presets (ultrafast, superfast).
>Under this condition, Skylake can outperform Haswell by more than 2x.

開発者曰くSkylakeでメモリ帯域のボトルネックが改善されたのが大きいとか
4K動画を軽いプリセットでエンコする時は特に有効とのこと

201 :Socket774:2016/12/24(土) 17:30:53.41 ID:2qDLwNHB
>>200
リングバス帯域が2倍になってたんだな

202 :Socket774:2016/12/24(土) 17:37:47.07 ID:Y5hbEkea
>>198
ラデのハードエンコやってみた。平均86fpsぐらい
qp20~35でエンコしたファイルとオリジナルのやつ(ここのx265ベンチのやつ)のzip
https://www.axfc.net/u/3756042/clickads

203 :Socket774:2016/12/24(土) 20:09:01.91 ID:Nag5DyNj
>>198
QSVのICQでもNVENCのCQPと画質は大して差が無いし、8bitだと品質を上げても暗部にビットレートを割かないのでバンディングやブロックノイズが酷くて低画質
NVENCのH.265 10bit以上の設定だと暗部の処理が目に見えて向上しているから、速度差も有るし8bitのみのQSVだと使うことは無いかな

ベンチのテスト結果ログ出力用batが無いみたいなので【テスト開始.bat】を作成
http://fast-uploader.com/file/7038132301044/

204 :Socket774:2016/12/24(土) 20:48:33.75 ID:qpdQ/8rp
nvenc 画質結構上がってるだろw
265とかソフトの264レベルあるぞ

205 :Socket774:2016/12/24(土) 20:54:49.86 ID:8icu6wdi
QSVはサイズがデカイ

206 :Socket774:2016/12/24(土) 22:30:20.48 ID:ZzzD5VZu
旧世代だけど多コア参戦。10C20T×2の計40T。
【CPU】Xeon E5-2660 V3×2個
【MEM】Crucial 4GB Reg.ECC×8個
【M/B】Supermicro X10DAi
【HDD】-
【SSD】Intel 910 400GB
【OS】 Win10 64bit

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

x265_Benchmark
【Veryfast】 64.52 fps CPU使用率60% CPUクロック2.8GHz
【. Medium】 28.99 fps CPU使用率50% CPUクロック2.8GHz
【  Slow】 12.00 fps CPU使用率45% CPUクロック2.8GHz

x265_Benchmark_3840
【Veryfast】 20.35 fps CPU使用率70〜80% CPUクロック2.7〜2.9GHz
【. Medium】 8.77 fps CPU使用率60〜70% CPUクロック2.8〜2.9GHz
【   Slow】 4.06 fps CPU使用率60〜80% CPUクロック2.7〜2.9GHz

さすがにCPU使用率100%にはならず。
次回更新予定のSkylake-EPでは高クロックモデルにしますわ・・・

207 :Socket774:2016/12/25(日) 00:08:57.87 ID:/tcXdUh0
渾身のスペシャルx265で再テスト。
スペシャルって言っても、単にPGOビルドしただk

元は>>152
PGO版もビルドバージョンは合わせて2.1+70(x64)
2K
付属>>152からコピペ
【Veryfast】 61.77 fps
【. Medium】 29.58 fps
【   Slow】 12.51 fps

自前PGOビルド
【Veryfast】 65.80 fps +6.5%
【. Medium】 31.83 fps +7.6%
【   Slow】 13.12 fps +4.9%

4K
付属
【Veryfast】 16.83 fps
【. Medium】 7.11 fps
【   Slow】 3.13 fps

自前PGOビルド
【Veryfast】 17.61 fps +4.6%
【. Medium】 7.70 fps +8.3%
【   Slow】 3.29 fps +5.1%

確実に効果はある、あるんだが・・・平均6%改善として、
60分エンコが57分弱になるだけなんだよな。。。
でも、CPUクロックで5%稼ごうとするとさらに+200MHz以上盛らないとだから、
その差は小さいわけでも無いんだが。

208 :Socket774:2016/12/25(日) 00:21:23.03 ID:/7ruLk78
>>207
PGOビルドするだけだけでそんな速くなるのか
一般にx264/x265は速度必要な部分は全てアセンブラコード
になってるからどうやってコンパイルしても速度がほとんど変わらない
みたいなのが定説だっただけに驚き
バイナリサイズどれくらいになる?

209 :Socket774:2016/12/25(日) 00:26:23.43 ID:PZbtkyiR
なる
そうやって%で見ると意外と大きい割合なのね

210 :Socket774:2016/12/25(日) 01:09:17.10 ID:/tcXdUh0
>>208
このPGOビルド版、12bitは除いてるんで8bit+10bitでの比較だが、
LTCG版 6.77 MB (7,107,584 バイト)
PGO版  6.63 MB (6,962,176 バイト)
こんな感じ。
最適化が効いてるのは、ループと条件分岐、後はキャッシュの使い方あたりか。
PGOって結局実際に動かして、よく使われる・使われない部分の頻度、条件分岐確立とか記録して、
使用頻度が低い部分を遅くしてでも、よく使われる部分を速く処理出来る様に最適化するから。

だから、当然PGOの場合、最適化用に食わせた設定・データによって、
最適化そのものが変わるんで、実用の場面では、自分の使う設定・データを元にしないと、
効果が出にくい事もあるかと。
まぁ、相当特殊な映像やオプション使わない限り、実写系とアニメ系をちょろっと食わせとけば、
大抵LTCG版より速くはなると思うけど。

今回のはベンチの設定+ベンチに付属の動画をそのまま食わせてる。
さすがに4kは全部食わせると、べらぼうに時間かかるんで、先頭の200フレ位しか使って無いが。
まぁそれがスペシャルの所以なんだけど。

211 :Socket774:2016/12/25(日) 05:06:48.54 ID:ak+ziLkV
CUDAの10bit/h265エンコまじで画質いいな
たまにタブやスマホで再生できないファイルが出来る問題さえクリアすれば
もうソフトエンコいらないかも

212 :Socket774:2016/12/25(日) 07:19:48.64 ID:1l9FvRMg
>>208
x264でもfprofiledするかどうかで3~5%ぐらい速度に差が出ることもあるぞ
大体のビルダーはやってると思う

213 :Socket774:2016/12/25(日) 09:41:18.31 ID:PZbtkyiR
しかりriagaya氏のもPGOを有効にしてビルドしてくれてるのに
>207の伸び率だから自環境で行うのが重要なんでは?

>>210
「ベンチに付属の動画」をソースにとのことだけど、x265にどうやって食わせてるの?
ベンチと同じくffmpeg経由?

214 :Socket774:2016/12/25(日) 10:02:24.00 ID:bWZhpJ/H
>>211
どのソフトでエンコしたのか良かったら教えて欲しい

215 :Socket774:2016/12/25(日) 10:38:21.30 ID:bWZhpJ/H
自分の使ってるグラボじゃダメなようです
お騒がせしました

216 :Socket774:2016/12/25(日) 11:06:58.80 ID:7H+OC5/h
>>213
ああ、>>101同梱のrigaya氏がコンパイルしたx265.exeも既にPGOビルドされてるのか

217 :Socket774:2016/12/25(日) 12:41:11.17 ID:U4HD2P+Q
モバイル用はまだ264で良いだろ
負荷高いとバッテリーきついし 保存用に

218 :Socket774:2016/12/25(日) 12:49:03.55 ID:Z6hYE7j+
最近のならHWデコーダついてるから変わらんだろ
1分でもバッテリーライフ長くとかならわからんが

219 :Socket774:2016/12/25(日) 13:17:54.65 ID:H0cRHBXr
>>217
むしろ、モバイル端末でのストリーミング再生用にこそ高圧縮率な動画規格が必要とされているんだがな
DoCoMoのdアニメストアとかは2年以上も前からH.265(HEVC)に対応開始しているし、最近のスマホは軒並みハードウェアデコードに対応している

220 :Socket774:2016/12/25(日) 14:32:21.90 ID:/tcXdUh0
>>213,216
あれ、rigaya氏が配布してるx265は現状、LTCG版だった気がするが・・・
最近確認してないけど、12bitのロジックがVSのPGOビルドするとぶっ壊れるので。
問題が直っていない&12bit処理まで含まれているビルドなら、恐らくPGOビルドしてない。
自分が12bit除いてPGO使ってるのも、上記問題があるからだし。
(そもそも使わないから、無くても問題ない)

ベンチ付属の動画をffmpegでy4mに変換したファイルを別に用意して食わせた。
実質、やってることはベンチと同じだな。

221 :Socket774:2016/12/25(日) 14:36:56.44 ID:PZbtkyiR
中身は知らないけど今も二種類用意されてるはず
rigayaさんが公開してくれてる自動ビルドバッチもpgo最適化ありだから
12bitまで含めてる非PGOのものと10bitまでのPGO版なのかもね

222 :Socket774:2016/12/25(日) 15:56:35.18 ID:U4HD2P+Q
ソフトエンコより確実に20倍は早いnvenc これからどんどん画質良く最適化されて将来性あるよなー
cudaの時は糞だったけど

223 :Socket774:2016/12/25(日) 16:03:03.10 ID:U4HD2P+Q
スマホとかタブでも265の再生支援が来ればすぐ普及だろうけど
あとtube

224 :Socket774:2016/12/25(日) 16:07:14.67 ID:v4fxPlmo
スマホタブは、もう何年も前からH265のハードデコードに対応してた気がするが

225 :Socket774:2016/12/25(日) 16:12:37.60 ID:U4HD2P+Q
アイフォンはしてたと思うけど
アンドロイドの低価格機とかだときついだろ ローエンドまで普通になればって事ねw

226 :Socket774:2016/12/25(日) 16:13:45.59 ID:KpTf3GeZ
使用料とかライセンスの問題でゴタゴタしてるのがネックなのでは

227 :Socket774:2016/12/25(日) 17:11:31.50 ID:H0cRHBXr
>>225
Androidの格安スマホでもHEVCのHWデコード対応しているが

税込 15,984円では高いか?
https://simseller.goo.ne.jp/category/ASUS/00002MAX16PRMOR_SIMSET.html

204 KB
新着レスの表示

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)