5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

【x264+Avisynth】実用エンコベンチ Part5.1 [無断転載禁止]©2ch.net

1 :Socket774:2016/04/07(木) 21:34:26.34 ID:zcrOJ+Cg
x264ベンチ報告スレです。

ベンチマークセットはここ
https://drive.google.com/file/d/0B8Fsw9b9NGgXS05ibE9RZUExQTg/edit?usp=sharing

構成はこんな感じで
【CPU】
【MEM】
【M/B】
【GPU】
【SSD/HDD】
【OS】
【x264】

前スレ
【x264+Avisynth】実用エンコベンチ Part4
http://potato.2ch.net/test/read.cgi/jisaku/1397956056/

107 :Socket774:2016/12/20(火) 20:15:36.42 ID:NN7CpcIu
>>105
CPU使用率は目測でveryfastが平均75%、slowだと50%程度だった
やっぱAVX2の威力はすごいね

108 :Socket774:2016/12/20(火) 20:21:44.32 ID:1wHMGOkn
>>101
5820KライトOCでやってみた。以前に比べるとx265も大分速くなっているね

x265_Benchmark

【CPU】i7-5820K(4GHz Cache3.8GHz)
【MEM】DDR4-2400 8GBx4
【M/B】ASUS X99-PRO/USB3.1
【HDD】HDN724040ALE640
【OS】 Win10 Home(1607) x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 44.38 fps
【. Medium】 22.53 fps
【   Slow】 9.14 fps

109 :Socket774:2016/12/20(火) 20:30:22.56 ID:7uvDby7z
6600kで走らせた

x265_Benchmark

【CPU】AMD A8-6600k(3.9GHz定格)
【MEM】DDR3 1333 4GB x2
【M/B】ASRock A88X Extream4+
【OS】 Win10 Pro x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX XOP FMA4 FMA3 LZCNT BMI1

【Veryfast】 9.55 fps
【. Medium】 5.26 fps
【   Slow】 2.27 fps


んでRyzenはBulldozer比で1.7倍というのを見たから
↑の数字を2倍して仮想FXの数値を割り出して、それを1.7倍とすると

【Veryfast】 32.47
【. Medium】 17.85
【   Slow】 7.718

基になった数字がほぼ4GHzだからそのあたりを差し引くと>106の6700を一回り下回るぐらいになる?

110 :Socket774:2016/12/20(火) 20:43:32.87 ID:XI+mQnqJ
x265 Benchmark

【CPU】i7-5960X@3.9GHz
【MEM】DDR4-2133 4GB x 4
【M/B】ASUS X99-A
【SSD】Plextor PX-256M8PeG
【OS】 Windows7 Professional 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 53.32 fps
【. Medium】 25.97 fps
【   Slow】 10.88 fps
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1

【Veryfast】 41.30 fps … -29%
【. Medium】 21.00 fps … -24%
【   Slow】 9.35 fps … -16%

111 :Socket774:2016/12/20(火) 21:09:34.45 ID:YaY275rh
>>109
1.7倍はワッパの数字だな
まあ性能も大本営発表によると「Broadwell-Eとタメを張る」という凄い話だけど
個人的には信じがたい、なんかトリックがあると思う

ワッパだけならブル比でその程度の改善はありうるが
それだけでは絶対性能はSandyにも追いつかないはず
本当にBroadwell-E並みの性能をBroadwell-Eの7割の電力で実現できてるなら
ワッパはブル比3倍近くにならないとおかしい

112 :98:2016/12/20(火) 21:32:46.44 ID:cVBgfF5Z
Slowがブルスクで落ちた
やけに静かだと思ったらCPUファンが回ってなかった
ファンの故障に気づかせてくれてありがとう(´・ω・`)

【CPU】i5 4690K@3.9GHz
【MEM】DDR3-2133 8GBx2
【M/B】Z97M-Pro4
【HDD】WD Blue 3TB
【SSD】Crucial M550
【OS】 Win10 64bit home Anniversary
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】 26.06fps
【. Medium】 13.45fps
【   Slow】 DNF

113 :Socket774:2016/12/20(火) 23:16:09.30 ID:7uvDby7z
>>111
重箱の隅をつつくと「Broadwell-Eとタメを張る」なんてことは言ってないんだな
Blenderでは「Broadwell-Eととほぼ同じ」ってだけで

> それだけでは絶対性能はSandyにも追いつかないはず

個人的にはそこまで厳しくはないと思う(と言ってもBroadwellと同等は99.9%無いと思ってる)
デコーダーも整数パイプも3だし、たとえすべて同じ仕様でも3年ぐらいの歳月があれば設計とかでカバーできる気がする

114 :Socket774:2016/12/20(火) 23:22:01.55 ID:rcTaP+DO
RyzenとCore i7-7700Kのベンチ結果は
ねつ造だったって記事ででてるよ

115 :Socket774:2016/12/20(火) 23:58:45.02 ID:1wHMGOkn
FX-8350でやってみた。AVXの効果はほぼ0だね

x265_Benchmark

【CPU】FX-8350(定格)
【MEM】DDR3-1866 8GBx4
【M/B】ASUS Crosshair V Formula
【HDD】HDN724040ALE640
【OS】 Win10 Home(1607) x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX XOP FMA4 FMA3 LZCNT BMI1

【Veryfast】 20.96 fps
【. Medium】 11.34 fps
【   Slow】 4.98 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 21.22 fps
【. Medium】 11.34 fps
【   Slow】 4.95 fps

116 :Socket774:2016/12/20(火) 23:59:27.99 ID:lp4x8Abw
出先から帰ってきた
みんなx265ベンチ参加ありがとう
参考になるよ
x265はAVX2の速さが思いっきり効くのがよくわかる

117 :Socket774:2016/12/21(水) 00:01:53.10 ID:2oblEjXE
>>115
こうして見るとx265におけるHaswell 4770とFX-8350の差は
AVX2の有無だけってのがよくわかるね

118 :Socket774:2016/12/21(水) 00:15:16.94 ID:CsQENohl
>>102-103のi7-4770は電源プラン:最大パフォーマンスで動作中のクロックは3.9GHzなんだよね?
x264と比較して>>112のi5-4690Kとの差が小さいのは
OSの差?それともHTTの効果が薄い?何だろうね

119 :Socket774:2016/12/21(水) 00:18:59.64 ID:/DVwg4LQ
無謀にも予備用録画鯖のK10 2コアでやってみた

x265_Benchmark

【CPU】AthlonII X2 240e
【MEM】DDR3-1600 2GBx2
【M/B】MSI 880GM-E41
【SSD】Plextor PX-256M5S
【OS】 Win10 Poe x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast LZCNT

【Veryfast】 1.52 fps

Medium以上は1時間コースだから無理ぽ…

120 :102:2016/12/21(水) 00:23:07.00 ID:dFDHW+D/
>>118

>>102の時は全コア3.7GHzに張り付いてるね
初期のBIOSの時は全コア3.9GHz張り付きにできたけど
途中のBIOSからそれができなくなった

121 :Socket774:2016/12/21(水) 00:23:13.29 ID:bBYxkQrp
>>118
メモリじゃね
多くの場合、特に明記してないかぎりバランスの可能性が高いと思う

122 :Socket774:2016/12/21(水) 00:25:44.01 ID:HWW+vDiz
>>118
周波数だろ
i7-4770はTurbo Boost 4Cは最大3.7GHzだ

123 :Socket774:2016/12/21(水) 00:28:29.78 ID:dFDHW+D/
x264ではメモリ半減にしても数%しか差がなかったけど

x264ベンチの方
メモリ2チャネル(DDR3 1600x2) → メモリ1チャネル(DDR3 1600x1)
【CPU】i7-4770(定格)
【Veryfast】 61.97fps → 57.26fps  (-7.6%)
【. Slower】 3.77fps → 3.74fps  (-0.08%)

x265だと差がもっと大きく出るかもね

124 :Socket774:2016/12/21(水) 00:31:07.46 ID:CsQENohl
K10世代は流石に厳しいね。6コアでも>>109のPiledriver世代APUに勝てない

x265_Benchmark

【CPU】PhenomII X6 1100T(3.8GHz NB2.6GHz)
【MEM】DDR3-1600 4GBx4
【M/B】 GIGABYTE GA-MA790FXT-UD5P
【HDD】HDS722020ALA330
【OS】 Win10 Pro(1607) x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast LZCNT

【Veryfast】 6.14 fps
【. Medium】 4.07 fps
【   Slow】 1.42 fps

125 :Socket774:2016/12/21(水) 00:31:33.92 ID:bBYxkQrp
>>123
ん、そんなものなのか(メモリ増やしてエンコ速度が向上ってどこかのHPで読んだ気がしてたが)
なんで121は完全な外れでした

126 :Socket774:2016/12/21(水) 00:32:01.45 ID:R9R6DsyX
x265 Benchmark


【CPU】 i7-6950X 4.2GHz
【MEM】 DDR4-3200 8GBx4
【M/B】 RAMPAGE V EXTREME
【SSD】 SanDisk SSDExtreme PRO 480GB
【OS】 Windows10Pro x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 72.01 fps
【. Medium】 35.54 fps
【  Slow】 14.32 fps
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 56.16 fps -28%
【. Medium】 28.46 fps -25%
【  Slow】 12.23 fps -17%

127 :Socket774:2016/12/21(水) 00:35:56.23 ID:CsQENohl
>>120-123
サンクス。4770TBクロックは3.7GHzか
メモリも差が出るなら今後はOCメモリを買う意義出番がありそうだな

128 :Socket774:2016/12/21(水) 00:38:39.70 ID:bBYxkQrp
>>124
マジか・・結構な差になるんだな
さすがにSS2止まりなのが原因だろうか

129 :Socket774:2016/12/21(水) 00:42:16.05 ID:bBYxkQrp
>>127
めんご
メモリ帯域はあんまり関係ないみたいだ・・

130 :Socket774:2016/12/21(水) 00:46:41.14 ID:dFDHW+D/
さっそく>>102からメモリ帯域半殺しで計測してみた

【CPU】i7-4770(定格)
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【MEM】DDR3-1600 4GBx2 → DDR3-1600 4GBx1(シングルチャネル)

【Veryfast】 29.15 fps → 27.09 fps (-7%)
【. Medium】 14.54 fps → 14.10 fps (-3%)
【   Slow】 5.98 fps  →  5.90fps  (-1.3%)

x264と同様にあんまり差がなかった

131 :Socket774:2016/12/21(水) 00:54:22.49 ID:dFDHW+D/
>>126
Broadwell-E 10C20Tすご過ぎワロタw

132 :Socket774:2016/12/21(水) 01:07:02.09 ID:HWW+vDiz
5960Xのついでに980Xでも試してみた

【CPU】i7-980X@定格(定格3.33GHz/TB 6C時最大3.46GHz)
【MEM】DDR3-1600 8GB x 3
【M/B】ASUS P6T
【SSD】Crucial C300 256MB
【OS】 Windows7 Ultimate 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 17.86 fps
【. Medium】 9.78 fps
【   Slow】 4.25 fps

>>125
Sandy Bridge-Eのメモリーチャンネル半減でx264エンコードが数%程度しか変わらなかったという記事を昔見たよ

133 :Socket774:2016/12/21(水) 02:02:57.72 ID:1hXJAFS5
>>124
PhenomII X6 1100T@3.8GHzって
未だにx264ならHaswell i7の7割くらいまで頑張れるのにな

134 :102:2016/12/21(水) 06:50:36.17 ID:we2Wqsgj
更にx265で拡張命令がどう効いてる詳細に調べてみた

x265_Benchmark

【CPU】i7-4770(定格)
【x265】2.1+70 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】 29.15 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】 28.81 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】 21.60 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】 21.43 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1
【Veryfast】 21.83 fps

【拡張命令】 MMX2 SSE2Fast SSSE3
【Veryfast】 8.61 fps

【拡張命令】 MMX2 SSE2
【Veryfast】 6.81 fps

【拡張命令】 MMX2
【Veryfast】 4.08 fps

【拡張命令】 none!
【Veryfast】 4.07 fps

135 :Socket774:2016/12/21(水) 06:55:18.67 ID:we2Wqsgj
比較対象としてx264の時の拡張命令の効き具合

【CPU】i7-4770(定格)
【x264】 r2377 x64 

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【.Veryfast.】 61.90 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【.Veryfast.】 61.64 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【.Veryfast.】 60.22 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【.Veryfast.】 59.26 fps

【拡張命令】 MMX2 SSE2Fast SSSE3
【.Veryfast.】 58.93 fps

【拡張命令】 MMX2 SSE2Fast
【.Veryfast.】 55.82 fps

【拡張命令】 MMX2
【.Veryfast.】 34.66 fps

【拡張命令】 none!
【.Veryfast.】 10.50 fps

136 :Socket774:2016/12/21(水) 06:56:50.39 ID:XkjFPj9/
>>134
MediumとSlowでも上5つの設定だけでいいんでやってみてください
お願いします

137 :Socket774:2016/12/21(水) 07:02:20.34 ID:we2Wqsgj
>>124
x264だと今でもそれなりの速度が出たPhenomII X6 1100Tあたりが
x265だと何でこんなに速度出ないかってのがよくわかる

x264だとSSE2、MMX2に思いっきり最適化されてるのに対して
x265だとSSE2にはあまり最適化されてなくて、MMX2に関してはほぼ最適化されてない
そしてAVX2と並んでSSE4.1への最適化が大きくて
SSE4.1に対応してないK10だと美味しい拡張命令がほとんど使えないようだ

138 :Socket774:2016/12/21(水) 07:07:37.11 ID:we2Wqsgj
>>136
他の人の例にもあるようにAVXとSSE4のうちSSE4.2で新規追加された分の命令は
ほとんど効いてないようなので、>>102-103の比較で十分だと思うけど、どうかな

139 :Socket774:2016/12/21(水) 08:14:19.86 ID:eocCKyAU
x264が世に出たのは2004年6月でPentium4とAthlon64の時代で
まだ使える整数演算の拡張命令がMMX2とSSE2しかなかったから
ひたすらこの2つに最適化させるしかなかった
一方でx265の安定版が世に出たのは2012年9月でHaswellが発売された
後だから既にAVX2があった頃

140 :Socket774:2016/12/21(水) 08:15:51.45 ID:eocCKyAU
あっ間違った
x265の初出が2013年で安定版リリースがやっと今年の9月だった

141 :112:2016/12/21(水) 08:40:32.88 ID:Ar3a0iIo
ありあわせのFANに交換して情報追加
HTの効率はx264に比べて若干低め?

【CPU】i5 4690K
【MEM】DDR3 8GBx2
【M/B】Z97M-Pro4
【HDD】WD Blue 3TB
【SSD】Crucial M550
【OS】 Win10 64bit home Anniversary
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

3.7/1600
【Veryfast】 24.27fps
【. Medium】 12.74fps

3.7/2133
【Veryfast】 24.69fps
【. Medium】 12.90fps

3.9/1600
【Veryfast】 25.18fps
【. Medium】 13.36fps

3.9/2133
【Veryfast】 26.06fps
【. Medium】 13.45fps

4.5/2133
【Veryfast】 29.66fps
【. Medium】 15.51fps

142 :Socket774:2016/12/21(水) 09:02:53.51 ID:9MBSfvQZ
HTの効率がx264に比べて若干低めって言うよりも
1スレッド分のコア使用度が高い感じ
x264の時は4C8TのCPUの場合はデフォ12thread走らせてるけど
それでも普通にネットしたり動画見れたりするけど
x265だとデフォできっちり8threadだけしか走らせてないけど
それでもうマウスカーソルがカクつくくらい処理能力使いきてっるのな

143 :Socket774:2016/12/21(水) 09:52:21.74 ID:bBYxkQrp
>>139
でもそれから13年も経とうかというのにSSE2止まりなのは
命令への最適化じゃなくコーデック規格自体がSSE2世代向けなんでは?
そこにいくとHEVCはGPGPUなどヘテロジニアス・プロセッシングも考慮に入れて策定されてるから
まだまだ伸びしろも十分ある・・のかもしれない

144 :Socket774:2016/12/21(水) 10:52:21.06 ID:TqyBZzVA
もうAVX2とかないのは使う気にならないな
電気の無駄だわ

145 :106:2016/12/21(水) 11:59:38.02 ID:vDy61RSB
>>106をやった限りだと
AVX2ぶん回した感想だと、それなりに負荷の高いゲームをやっているときより+10度くらいコア温度が高かったんで
消費電力を測ったわけじゃないが、結構電気も食ってそうだったぜ

146 :Socket774:2016/12/21(水) 12:02:22.91 ID:TqyBZzVA
occt AVXと同じ負荷かかってんだろうな

147 :Socket774:2016/12/21(水) 15:46:54.37 ID:MJYnUw5Z
>>141
意外とメモリクロックは効くね
もっと誤差レベルかと思ってた

148 :Socket774:2016/12/21(水) 15:57:11.12 ID:POkMsiTM
>>143
x264も数年前からSSE2用以前のアセンブラコードにはほとん手が入ってないと思う
それでも10年近く地道にSSE2、MMX2に最適化してきた
アセンブラコードの改良の積み重ねは伊達じゃない
一方でx265はSSSE3以前しか使えない環境に対する
アセンブラコードなんてまともに開発して意味がある時代じゃなくなってるからな

149 :Socket774:2016/12/21(水) 16:16:47.80 ID:POkMsiTM
x265の開発が本格化した2013年の時点では
AVX2を使えるCPUとSSE4まで使えるCPUの2つだけに
アセンブラ最適化のターゲットしぼれば開発リソースの節約になって
SSE4は使えないけどSSE4aなら使えるというニッチなCPUが
K10しかなかったからSSE4が使えないK10は切り捨てられたんだろうな

150 :Socket774:2016/12/21(水) 18:11:09.57 ID:CwDOCZOb
x264もK10に対してはここ4年ほどで

MMX2 SSE2Fast FastShuffle SSEMisalign LZCNT
      ↓
MMX2 SSE2Fast SSEMisalign LZCNT
      ↓  
MMX2 SSE2Fast LZCNT

と、使用されてる拡張命令がコードから次々とリストラされてるようだ

151 :Socket774:2016/12/21(水) 18:57:15.49 ID:bBYxkQrp
>>148
AVX化で数パーセントでも時間短縮できるなら
どこかの暇なギークがせっせとコミットするだろうけど、
実際そうじゃないのは団子が言うように根本的に向いてないんだろうな

152 :Socket774:2016/12/21(水) 19:15:56.45 ID:Lc7Nyxx2
俺もやってみた。
消費電力除けば、BroとHasのコア性能はそんなに変わらないという、
当たり前の結果に。

【CPU】i7-5960X@4.3GHz
【MEM】DDR4-2400 4GB x 4
【M/B】ASUS X99-DELUXE
【SSD】Intel 750 400GB
【OS】 Win10 pro 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 61.77 fps
【. Medium】 29.58 fps
【   Slow】 12.51 fps

>>151
結局H264/H265どちらも、整数演算しか使わないので、
浮動小数点のみのAVXじゃ、ロード・ストア系除く命令は使い道が無いってだけじゃ。

153 :Socket774:2016/12/21(水) 20:07:15.04 ID:bBYxkQrp
話の筋的にはAVX2も含む

154 :Socket774:2016/12/21(水) 21:48:35.03 ID:CsQENohl
Bloomfieldでもやってみた。世代の割には頑張るね。
ただこのクロックだとFX-8350より熱いw

x265 Benchmark

【CPU】 i7-930(3.8GHz Uncore3.2GHz)
【MEM】 DDR3-1600 4GBx6
【M/B】 GA-X58A-UD7 rev1.0
【SSD】 HDS722020ALA330
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 17.40 fps
【. Medium】 9.30 fps
【  Slow】 3.94 fps

155 :Socket774:2016/12/21(水) 23:10:29.98 ID:HWW+vDiz
5960Xと980XのついでにQ9650でも試してみた

【CPU】Core2 Quad Q9650@3.6GHz
【MEM】DDR2-1066 2GB x 2
【M/B】ASUS P5Q-E
【SSD】Crucial BX100 250GB
【OS】 Windows10 Home 64bit
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1

【Veryfast】 9.04 fps
【. Medium】 4.98 fps
【   Slow】 2.00 fps

156 :Socket774:2016/12/21(水) 23:17:29.36 ID:VBi+RUO3
>>124
>>155
x264だとコア数の差がそのまま出て1.5倍ほど速いであろう
PhenomII X6 1100T@3.8GHzが、x265だと
逆に1.5倍差付けられて負けてるところが興味深いな

157 :Socket774:2016/12/21(水) 23:31:53.76 ID:ascnGhxd
【CPU】i7-4702MQ(Haswell)
【MEM】DDR3 8GB
【GPU】Intel HD4600
【OS】Win10 Anniversary Home x64
【x265】2.1+70(x64)

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】21.72 fps
【 Medium】11.08 fps
【   Slow】 4.44 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】21.38 fps
【 Medium】10.92 fps
【   Slow】 4.30 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】16.57 fps
【 Medium】 8.77 fps
【   Slow】 3.72 fps

【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】16.31 fps
【 Medium】 8.53 fps
【   Slow】 3.65 fps

158 :Socket774:2016/12/22(木) 08:33:07.18 ID:iGZiIH1t
x265_Benchmark

【CPU】Xeon E5 2650L v3 定格 HT 無効/TB 有効
【MEM】DDR4-2133 16GB x4
【M/B】ASRockRack EPC612D4i
【SSD】Crutial CT250MX200SSD1
【OS】 Windows Server 2012 R2 Update
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 35.40 fps
【. Medium】 18.32 fps
【   Slow】 7.35 fps

12c 2.1Ghz じゃそこまで早くはならないぽ

159 :Socket774:2016/12/22(木) 09:01:39.77 ID:FwjGpy84
x265 Benchmark

【CPU】 i7-3930k@4.0GHz
【MEM】 DDR3-1866 4GBx4
【M/B】 X79 Professional
【SSD】 Crucial MX100 512GB
【OS】 Windows7Pro x64
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX

【Veryfast】 26.61 fps
【. Medium】 14.87 fps
【  Slow】 6.44 fps

160 :Socket774:2016/12/22(木) 12:27:48.82 ID:35fahdgU
x265

i5 6600 定格
ddr4 2133 x2
h110m hdv
ssd seagete 600 240GB

slow 5.7 fps

161 :Socket774:2016/12/22(木) 12:30:09.32 ID:35fahdgU
i7 4770 に近いぐらいのスピード出ててびっくり
h265は skylake 有利だね

162 :Socket774:2016/12/22(木) 13:46:35.85 ID:1qTSMMqR
E5 2650L v3 なら >>108 と同じくらいの CPU クロック合計なのに速度出ないの残念だ…

163 :Socket774:2016/12/22(木) 15:33:25.79 ID:RzAAUxH9
x265でスレが盛り上がっていいぞ〜

164 :Socket774:2016/12/22(木) 18:15:58.62 ID:P48w/RJH
>>119だけど、K10の切り捨てられっぷりが話題になってたので
更に無謀にも --no-asm でもやってたみ

265_Benchmark

【CPU】AthlonII X2 240e
【MEM】DDR3-1600 2GBx2
【M/B】MSI 880GM-E41
【SSD】Plextor PX-256M5S
【OS】 Win10 Poe x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast LZCNT
【Veryfast】 1.52 fps
    ↓
【拡張命令】 none!
【Veryfast】 0.89 fps

K10はアセンブラコード無しと有りで1.7倍しか変わらない

一方でx264と同じような比較してみると
【x264】r2334 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSEMisalign LZCNT
【Veryfast】 10.90 fps
    ↓
【拡張命令】 none!
【Veryfast】 2.03 fps

って感じで5倍差が出てる
>>134のi7-4770みたいに7倍とはいかなくても
4倍差くらいあったら>>124の1100Tあたりはまだ頑張れそうなのに

165 :Socket774:2016/12/22(木) 18:56:24.90 ID:CsnhnEI/
K10向けにカリカリに最適化してもそんな伸びないよ
アムドの拡張命令実装は大概「とりあえず動く」レベルであって、性能が出るレベルじゃない
ZenもAVXがDoublePath、BMIはVectorPathなんて仕様だから、あんま期待しない方がいい
純スカラ整数コードならイッテルの4Cは軽く蹴散らし、うまくすると6Cとも張り合えるだろうが
エンコだと4Cにも勝てるかどうか怪しい

166 :Socket774:2016/12/22(木) 19:34:13.07 ID:QCBwn+5y
田村は他でやってね

167 :Socket774:2016/12/22(木) 20:21:21.95 ID:8o8dpJYf
DTVやソフ板なら宗教戦争持ち込むなハゲ、の一言で済むけどここ自作PC板なんだよな
ま、コアの性能自体は置いといて、エンコは基本マルチコア化が超有効だから4コアに負けることは無いはず
例えばIntelでのx265はAVX2の有無で30%の性能差があるが、コア数が倍になれば所要時間はほぼ半分になるし

168 :Socket774:2016/12/22(木) 20:26:07.58 ID:Gbl4UwPE
そうか?

169 :Socket774:2016/12/22(木) 20:29:05.06 ID:KQ/lkdvF
8コアでもイソテル4コアに負けるのがAMD

170 :Socket774:2016/12/22(木) 20:35:39.25 ID:8o8dpJYf
実のところBulldozer(モジュール)は2スレッド実行できる1コアだよ
>167の書き方が悪いんだけど、最後の段落はIntelにも当てはまるのは分かるでしょ

171 :Socket774:2016/12/22(木) 22:49:43.88 ID:+kc8Fkcq
自作ではないけど比較用に。2C2Tではこんなものかな

x265 Benchmark

【CPU】 Celeron N2820(2.4GHz)
【MEM】 DDR3-1333 2GBx2
【M/B】 DN2820FYKH
【SSD】 SanDisk Extreme PRO 480GB
【OS】 Windows10Pro(1607) x64
【x265】2.1+70 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2

【Veryfast】 1.82 fps
【. Medium】 0.96 fps
【   Slow】 0.42 fps

172 :Socket774:2016/12/23(金) 00:16:06.63 ID:K3WuwBFD
やっと265の時代か 

173 :Socket774:2016/12/23(金) 00:58:48.34 ID:mdrOl6nv
x264も大分変わったからまたやらないといけないな

174 :Socket774:2016/12/23(金) 04:45:27.17 ID:4ULyquge
エンコの宝刀・AVX2はcoreシリーズだけの装備なのか…

175 :102:2016/12/23(金) 09:08:02.44 ID:/VJqy3uU
>>141
> HTの効率はx264に比べて若干低め?

HTの効果の度合いをx265とx264で比較してみた

【CPU】i7-4770(定格:エンコ中全コア3.7GHz)
【MEM】DDR3-1600 4GBx2
【M/B】ASUS H87M-Pro
【SSD】Plextor PX-M5S
【OS】 Win7 x64 Pro
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

  HT無し(4C4T)  →  HT有り(4C8T)

【x265】2.1+70 (x64)
【Veryfast】 24.76 fps → 29.15 fps (+17.7%)
【. Medium】 12.82 fps → 14.54 fps (+13.4%)
【   Slow】 5.38 fps → 5.98 fps (+11.2%)


【x264】r2638 (x64)
【Veryfast】 52.33 fps → 62.30 fps (+19.1%)
【. Medium】 14.01 fps → 16.71 fps (+19.3%)
【   Slow】 6.64 fps → 7.62 fps (+14.8%)


推察の通りにx264に比べると、x265はHTの優位性は少し低いね

176 :Socket774:2016/12/23(金) 10:04:55.00 ID:z7gvtvVC
i5とi7だと4割近く上がってるはずだけど(x264で)それどうやってON/OFFで計測したの?
エンコーダー側のスレッド数を変えた感じ?

177 :Socket774:2016/12/23(金) 10:25:57.59 ID:/VJqy3uU
マザーのUEFIでHTT有効/無効が切り替えられる

178 :Socket774:2016/12/23(金) 10:28:02.13 ID:/VJqy3uU
それと、同クロックでさすがにHTTの有無では4割も差は出てないよ
過去のこのスレの数々の結果かから見ても

179 :Socket774:2016/12/23(金) 10:52:38.06 ID:z7gvtvVC
そうなの?
価格.comの掲示板で4割近く上がるからi7絶対おすすめって書かれてたから
そうなのかと思ってた

180 :Socket774:2016/12/23(金) 10:55:03.86 ID:K3WuwBFD
sky傾向なら十分実用的になったな

181 :Socket774:2016/12/23(金) 11:19:43.98 ID:K3WuwBFD
ここ見ててマザーで切り替えられるの知らないとかネタだろwwwさすがに

182 :Socket774:2016/12/23(金) 11:57:01.35 ID:/QeKjCI0
【CPU】i7 6950X@4.35GHz(127.9*34), Cache@3.71GHz
【MEM】G.Skill F4-3400C16Q-16GRBD@DDR4-3410 16-18-18-38 1T
【M/B】ASUS Rampage V Extreme
【SSD】SanDisk Extreme PRO 480GB
【OS】 Windows7 Pro 64bit SP1
【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 75.87 fps
【. Medium】 37.02 fps
【.  Slow】 15.07 fps


あとベンチ用の元動画を適当に4K(3840x2160)にリサイズ、再エンコして4Kで測定できるようにしてみた

x265_Benchmark_4K対応版
https://1drv.ms/u/s!Akfj_vsVPKU9gjcuOu3swPN98u-7

x265_Benchmark_3840

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 20.84 fps
【. Medium】 9.18 fps
【.  Slow】 4.08 fps

183 :182:2016/12/23(金) 12:28:22.64 ID:/QeKjCI0
OneDriveのURLがInvalid URIになってしまうようなので
https://drive.google.com/file/d/0B8o-zISICm3lRXg4dTdaVnBOWkk/view?usp=sharing

184 :Socket774:2016/12/23(金) 13:08:22.69 ID:eqByT/Ck
6950Xといえども流石に4KではMedium 10fps超えは無理か

185 :Socket774:2016/12/23(金) 13:13:59.44 ID:K36congF
2万3万円の普通に売っているCPUで、4kをまともな速度でエンコできるようになるには
もう3回か4回くらいシュリンクやアーキテクチャ変更が必要じゃねえ

186 :Socket774:2016/12/23(金) 13:28:20.93 ID:4CPAJTU4
あと2,3世代で頭打ちと言われてる

187 :182:2016/12/23(金) 14:04:53.36 ID:/QeKjCI0
--pools 64 --frame-threads 16 オプションつけたらCPU使用率が上がって若干早くなった

x265_Benchmark(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 83.50 fps
【. Medium】 38.88 fps
【.  Slow】 15.80 fps

x265_Benchmark_3840(--pools 64 --frame-threads 16)

【x265】2.1+70 (x64)
------------------------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【.Veryfast】 21.69 fps
【. Medium】 9.73 fps
【.  Slow】 4.23 fps

4KだとMedium以上でCPUほぼ100%使い切るようになった

188 :Socket774:2016/12/23(金) 14:43:46.27 ID:K3WuwBFD
>>185
10コアぐらいが普通にならないときついんかね

189 :Socket774:2016/12/23(金) 14:45:38.14 ID:K3WuwBFD
fhdの265で もうかなり満足な画質だけどねえ

190 :Socket774:2016/12/23(金) 14:59:57.65 ID:qFQdMT4m
そもそもx265がまだ未成熟だというのを忘れてはいけない
今年も速度が向上したり機能が追加されたりしている

191 :Socket774:2016/12/23(金) 15:44:13.37 ID:z7gvtvVC
現状から劇的に上がるのかねぇ
今の停滞が次のジャンプのための準備期間だったらいいんだが

192 :Socket774:2016/12/23(金) 15:53:56.41 ID:rdeNfqjo
停滞してるなんて思わないなあ
まあもっと軽くはなって欲しいけど

193 :Socket774:2016/12/24(土) 01:57:46.76 ID:Uu3jzn1g
HTTの利点は、よりフルロードに貼り付けやすくするだけだから
過多スレッドでブン回して100%に貼り付けたら同クロック動作の4Cなi7とi5ならキャッシュの差しか無い
逆に100%張り付かないエンコーダやベンチ、ゲームなんかではCPUロードが稼ぎやすくTurboBoostのクロックも高く推移させやすくなるから重宝されるし価値がある

194 :Socket774:2016/12/24(土) 07:38:31.79 ID:LEOxNhyp
        ____
        /     \
     /   ⌒  ⌒ \   何言ってんだこいつ
   /    (●)  (●) \
    |   、” ゙)(__人__)”  )    ___________
   \      。` ⌒゚:j´ ,/ j゙~~| | |             |
__/          \  |__| | |             |
| | /   ,              \n||  | |             |
| | /   /         r.  ( こ) | |             |
| | | ⌒ ーnnn        |\ (⊆ソ .|_|___________|
 ̄ \__、(“二) ̄ ̄ ̄ ̄ ̄l二二l二二  _|_|__|_

195 :Socket774:2016/12/24(土) 08:36:34.57 ID:3bIdIGKY
このベンチは4C4Tでやっても8C8Tでやっても
同じく100%付近に張り付いたまま>>175の差が出るってことを
知らずに書いてるのは間違いない

196 :Socket774:2016/12/24(土) 08:37:00.30 ID:3bIdIGKY
8C8Tじゃなくて4C8Tだ

197 :Socket774:2016/12/24(土) 13:19:49.00 ID:Nag5DyNj
【CPU】i7-6700(全コア3.7GHz -offset0.16V)
【MEM】DDR4-2133 8GB x 4
【M/B】ASUS Z170M-PLUS
【SSD】CT960M500
【OS】 Win7 Pro x64
【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

【Veryfast】 34.14 fps
【. Medium】 16.87 fps
【   Slow】 6.83 fps

アイドル 26W、x265エンコ 75W、x264エンコ 75W、OCCT LINPAK 88W、Prime95v2810 96W
同じソースを使ってGTX1050Ti NVEncC CQPエンコ時max84W
HEVC 246.94fps、HEVC 10bit 255.03fps、HEVC YUV444 10bit 153.39fps

198 :Socket774:2016/12/24(土) 14:12:46.64 ID:XtzQctDZ
NVEncはさすがに品質が糞すぎるのでせめてQSVのICQと比べておくれ

199 :Socket774:2016/12/24(土) 17:03:28.62 ID:2qDLwNHB
>>197
やっぱりSkylakeはx265大得意だな

200 :Socket774:2016/12/24(土) 17:27:59.97 ID:EkX2J8zn
>>199

>A key improvement in Skylake is the internal ring bus, which has double the memory bandwidth of the previous CPU generation (Haswell/Broadwell).
>The internal ring moves data inside the CPU, from cache memory to logic units in each core, and back again.
>Our performance profiling shows that x265 performance is often constrained by the memory bandwidth of Haswell generation cores which is about 20 GB/sec.
>Skylake cores have about 40 GB/sec bandwidth, removing this bottleneck.

>For 4K encoding on a quad-core desktop, we see a memory bandwidth bottleneck on Haswell processors with our fastest presets (ultrafast, superfast).
>Under this condition, Skylake can outperform Haswell by more than 2x.

開発者曰くSkylakeでメモリ帯域のボトルネックが改善されたのが大きいとか
4K動画を軽いプリセットでエンコする時は特に有効とのこと

201 :Socket774:2016/12/24(土) 17:30:53.41 ID:2qDLwNHB
>>200
リングバス帯域が2倍になってたんだな

202 :Socket774:2016/12/24(土) 17:37:47.07 ID:Y5hbEkea
>>198
ラデのハードエンコやってみた。平均86fpsぐらい
qp20~35でエンコしたファイルとオリジナルのやつ(ここのx265ベンチのやつ)のzip
https://www.axfc.net/u/3756042/clickads

203 :Socket774:2016/12/24(土) 20:09:01.91 ID:Nag5DyNj
>>198
QSVのICQでもNVENCのCQPと画質は大して差が無いし、8bitだと品質を上げても暗部にビットレートを割かないのでバンディングやブロックノイズが酷くて低画質
NVENCのH.265 10bit以上の設定だと暗部の処理が目に見えて向上しているから、速度差も有るし8bitのみのQSVだと使うことは無いかな

ベンチのテスト結果ログ出力用batが無いみたいなので【テスト開始.bat】を作成
http://fast-uploader.com/file/7038132301044/

204 :Socket774:2016/12/24(土) 20:48:33.75 ID:qpdQ/8rp
nvenc 画質結構上がってるだろw
265とかソフトの264レベルあるぞ

205 :Socket774:2016/12/24(土) 20:54:49.86 ID:8icu6wdi
QSVはサイズがデカイ

206 :Socket774:2016/12/24(土) 22:30:20.48 ID:ZzzD5VZu
旧世代だけど多コア参戦。10C20T×2の計40T。
【CPU】Xeon E5-2660 V3×2個
【MEM】Crucial 4GB Reg.ECC×8個
【M/B】Supermicro X10DAi
【HDD】-
【SSD】Intel 910 400GB
【OS】 Win10 64bit

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

x265_Benchmark
【Veryfast】 64.52 fps CPU使用率60% CPUクロック2.8GHz
【. Medium】 28.99 fps CPU使用率50% CPUクロック2.8GHz
【  Slow】 12.00 fps CPU使用率45% CPUクロック2.8GHz

x265_Benchmark_3840
【Veryfast】 20.35 fps CPU使用率70〜80% CPUクロック2.7〜2.9GHz
【. Medium】 8.77 fps CPU使用率60〜70% CPUクロック2.8〜2.9GHz
【   Slow】 4.06 fps CPU使用率60〜80% CPUクロック2.7〜2.9GHz

さすがにCPU使用率100%にはならず。
次回更新予定のSkylake-EPでは高クロックモデルにしますわ・・・

204 KB
新着レスの表示

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)