5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

【x264+Avisynth】実用エンコベンチ Part5.1 [無断転載禁止]©2ch.net

1 :Socket774:2016/04/07(木) 21:34:26.34 ID:zcrOJ+Cg
x264ベンチ報告スレです。

ベンチマークセットはここ
https://drive.google.com/file/d/0B8Fsw9b9NGgXS05ibE9RZUExQTg/edit?usp=sharing

構成はこんな感じで
【CPU】
【MEM】
【M/B】
【GPU】
【SSD/HDD】
【OS】
【x264】

前スレ
【x264+Avisynth】実用エンコベンチ Part4
http://potato.2ch.net/test/read.cgi/jisaku/1397956056/

441 :Socket774:2017/03/04(土) 12:03:43.86 ID:WVoqgH7L
>>434
CPU-Zは短時間で終わるベンチなのでLN2使えば無茶な設定でも通せると思うぞ
OCCTが絶対通らない設定でも通るから

442 :Socket774:2017/03/04(土) 13:45:35.83 ID:ChBItfgp
Ryzen比較用に、6950X@4.0GHzで回してみた

【CPU】i7 6950X@4.0GHz(100.1*40), Cache@3.7GHz
【MEM】G.Skill F4-3400C16Q-16GRBD@DDR4-3400 16-18-18-38 1T
【M/B】ASUS Rampage V Extreme
【SSD】SanDisk Extreme PRO 480GB
【OS】 Windows7 Pro 64bit SP1
---------------
【x264】r2744 (komisar,x64)

【Veryfast】 120.32 fps
【. Medium】 41.67 fps
【   Slow】 24.76 fps
【. Slower】 9.57 fps

【x265】2.1+70 (x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

FHD
【.Veryfast】 69.66 fps
【. Medium】 34.16 fps
【.  Slow】 13.93 fps

4K
【.Veryfast】 19.47 fps
【. Medium】 8.51 fps
【.  Slow】 3.82 fps

Ryzen普通に早いね

443 :Socket774:2017/03/04(土) 13:57:00.40 ID:/HeVcHBD
>>442
x265が速過ぎて笑うw

444 :Socket774:2017/03/04(土) 14:01:07.40 ID:/HeVcHBD
>>422
そこから更に--opencl入れるとx264どれくらいになるかな?

445 :Socket774:2017/03/04(土) 14:48:35.36 ID:08+9AyNi
>>442
流石10コア20スレッドは早いな

446 :Socket774:2017/03/04(土) 14:52:03.86 ID:KxEhv3QM
1800XのOC次第で肉薄すると思うわ、そしたら値段4分の1でタメはられることになる

447 :Socket774:2017/03/04(土) 15:39:08.67 ID:ChBItfgp
>>444
設定元に戻してしまったのでCPU、メモリクロック違ってますが

【CPU】i7 6950X@4.35GHz(127.9*34), Cache@3.71GHz
【MEM】G.Skill F4-3400C16Q-16GRBD@DDR4-3410 16-18-18-38 1T
【M/B】ASUS Rampage V Extreme
【GPU】SAPPHIRE Radeon R9 FuryX
【SSD】SanDisk Extreme PRO 480GB
【OS】 Windows7 Pro 64bit SP1
---------------
【x264】r2744 (komisar,x64)

【Veryfast】 123.02 fps
【. Medium】 44.90 fps
【   Slow】 26.75 fps
【. Slower】 10.29 fps

--opencl
【Veryfast】 135.58 fps
【. Medium】 46.05 fps
【   Slow】 27.28 fps
【. Slower】 10.29 fps

--threads 128
【Veryfast】 128.06 fps
【. Medium】 47.58 fps
【   Slow】 29.34 fps
【. Slower】 11.42 fps

--opencl --threads 128
【Veryfast】 136.55 fps
【. Medium】 48.87 fps
【   Slow】 30.24 fps
【. Slower】 11.63 fps

448 :Socket774:2017/03/04(土) 15:39:53.22 ID:ChBItfgp
ついでに
【x265】2.3+6 (rigaya氏PGOビルド,x64)
---------------
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

FHD
【.Veryfast】 78.34 fps
【. Medium】 38.77 fps
【.  Slow】 15.54 fps

4K
【.Veryfast】 21.34 fps
【. Medium】 9.59 fps
【.  Slow】 4.27 fps

--pools 64 --frame-threads 16
FHD
【.Veryfast】 85.77 fps
【. Medium】 40.69 fps
【.  Slow】 16.29 fps

4K
【.Veryfast】 22.22 fps
【. Medium】 10.17 fps
【.  Slow】 4.40 fps

ベンチ付属のバージョンで回したのは>>182,>>187

449 :Socket774:2017/03/04(土) 15:45:58.08 ID:ChBItfgp
>>444
ごめん、間違えたw
自分にレスしてるのかと思ったw
よく見たら>>422宛だったわ

450 :Socket774:2017/03/04(土) 21:55:32.63 ID:Nxw4cQQE
>>440
輝いていたころの6900K
http://potato.2ch.net/test/read.cgi/jisaku/1428418974/822-

451 :Socket774:2017/03/04(土) 22:37:12.51 ID:m8V3DZGw
>>444
どこかのスレで高精度イベントタイマー(HPET)を切るとパフォーマンスが上がると書いてあったので
--opencl入れるついでに計測し直しました

【CPU】RYZEN R7 1800X@4.0GHz HPET無効
【MEM】DDR4-2400 8GBx2 (15-15-15-35-2T)
【M/B】ASRock Fatal1ty X370 Professional Gaming BIOS 1.40
【GPU】SAPPHIRE NITORO+ RX 480
【SSD】Patriot Hellfire M.2 480GB (PCIE3.0x4)
【OS】 Windows 10 Pro x64
---------------
【x264】r2744 (x64)

【Veryfast】 103.02 fps, 33405.22 kb/s
【. Medium】 34.79 fps, 34733.47 kb/s
【   Slow】 21.09 fps, 34761.34 kb/s
【. Slower】 8.09 fps, 34089.92 kb/s

--opencl
【Veryfast】 108.36 fps, 33403.72 kb/s
【. Medium】 36.24 fps, 34713.13 kb/s
【   Slow】 21.74 fps, 34680.62 kb/s
【. Slower】 8.17 fps, 33985.16 kb/s

--asm AVX
【Veryfast】 104.43 fps, 33405.22 kb/s
【. Medium】 35.83 fps, 34734.02 kb/s
【   Slow】 21.57 fps, 34761.34 kb/s
【. Slower】 8.36 fps, 34089.74 kb/s

--asm AVX --opencl
【Veryfast】 110.12 fps, 33403.56 kb/s
【. Medium】 37.29 fps, 34713.39 kb/s
【   Slow】 22.21 fps, 34680.59 kb/s
【. Slower】 8.45 fps, 33985.90 kb/s

452 :Socket774:2017/03/04(土) 22:40:05.92 ID:Y49bDZo/
355 名前:Socket774[sage] 投稿日:2017/03/04(土) 19:38:30.40 ID:Cl4iZstW [3/3]
前はCPUの購入判断にエンコがあったけど今はゲーム性能でどれだけ上がるかしか見てない
エンコはGPUにやらせたほうが、もうそれこそCPUとは別次元の早さだし比較すること自体意味ないかな

ryzenは悪くないと思うがいくらマルチスレッドとかエンコ性能上がろうがゲームで負けてる時点でスルー確定

こいつわかってなくて笑うわ
フィルター処理が重いんだよ GPUが対応してるフィルター処理なんか僅かだろ
CPUの重いプラグインなんか腐るほどある

453 :Socket774:2017/03/04(土) 23:03:56.62 ID:IisFNq33
なんでこのスレの人間はx265のエンコにわざわざ古いバージョン使ってんだ?
もう2.3まで出てるだろ

454 :Socket774:2017/03/04(土) 23:14:33.68 ID:eeQo89KR
目的がエンコすることじゃなく、「比較すること」だからじゃないかな
新バージョン化でpresetのパラメータ内容(とその影響でエンコ速度)までがらっと変わることもあるから

まあ既に2.3の結果うpしてる人もいるし、これからRyzenに合わせた最適化とかも入ってくるかもだから、
急がなくてもここで使われるバージョンも切り替わっていくでしょ

455 :Socket774:2017/03/04(土) 23:15:05.01 ID:KkkDCFdQ
GPUをフィルタに使うんじゃなくてQSVやNVENCやVCEのHWエンコを言ってるんだと思うよ

このエンコベンチ用のソースならNVENCのH.264なら310fps、H.265 10bitでエンコした場合110fps程度出るし
NVENCやKabyのH.265 10bitならHWエンコの苦手な暗いシーンもバンディングやブロックノイズも無く十分見れる画質になってるし

使うエンコソフトや古いCPUによってはその1/3の速度も出無かったりするけど

456 :Socket774:2017/03/04(土) 23:15:26.25 ID:qI3kNY4/
つ、釣られませんよ(キリ

457 :Socket774:2017/03/04(土) 23:23:02.98 ID:pm/caBv4
>>453
ver.の割に中身変ってないから気にするな
開発の超盛んだったx264の時は最新x264バイナリでの計測がお約束だったけど
ほとんど動きのないx265はそういう需要が少な目

458 :Socket774:2017/03/05(日) 00:01:05.09 ID:Ju1Pyof6
暗部に関してはソフトエンコに逆立ちしても勝てないよ
まあモニタを輝度100%とかで使えば気づかないかもしれないけどね
DTV板でこんなこといったら総スカンくらうよ

459 :Socket774:2017/03/05(日) 00:21:28.44 ID:ee4T5ywz
ベースの画質が違いすぎるからやる人居ないだろうけど
10bitならQSVでも目立たないんじゃないの

460 :Socket774:2017/03/05(日) 00:26:35.44 ID:LbimSZFG
GPU/iGPUにHWエンコーダが当たり前のように乗ってるのに
みんなx264とかのソフトエンコ使うのは画質が比較にならないくらい違うからだよ

461 :Socket774:2017/03/05(日) 00:41:31.98 ID:K1JSxsJr
QSVは出来上がりファイルサイズがでかいからそれならTSのままでいいやになる

462 :Socket774:2017/03/05(日) 01:31:48.02 ID:9L/UULo9
>>451
乙!
なんちゅう圧倒的なスコアだ…これで65000円とは信じられない

463 :Socket774:2017/03/05(日) 02:48:45.50 ID:ee4T5ywz
1.9vで6GHzか
消火器用意した方がいいなw

464 :Socket774:2017/03/05(日) 02:51:48.39 ID:ee4T5ywz
>>461
QSVって、つべのようにBフレーム0 cabac オフなんでしょ
そりゃそうなるよな

465 :Socket774:2017/03/05(日) 10:09:11.54 ID:MOnttTHu
GPUエンコ言ってる奴の実際にしてない感は異常w、エンコする理由は画質を保ちつつファイルサイズを抑える事が目的なんだ
そしてそれを満たすのがCPUによるエンコしかないないのが現状だ、x265でファイルサイズ大きいとか存在の否定なわけで
Nv・AMD問わず全フィルタ処理をGPUでCPUと同等かそれ以上に出来るなら皆そっちに任せるけどね

466 :Socket774:2017/03/05(日) 10:15:44.38 ID:om9Qz8hl
>>465
>十分見れる画質になってるし

本人はそれで満足してるみたいだし別にいいんじゃね

467 :Socket774:2017/03/05(日) 11:55:31.86 ID:MOnttTHu
そんなんで満足してる奴はスレに来る必要ないやん・・・

468 :Socket774:2017/03/05(日) 12:01:21.27 ID:XGkn/0fx
ベンチはやりたいんだろう

469 :Socket774:2017/03/05(日) 12:25:48.27 ID:om9Qz8hl
ryzen 7 1700入金したっ!

でもマザーがないw

470 :Socket774:2017/03/05(日) 14:16:20.85 ID:QPLuVBuq
海外フォーラムでwindowsがRyzenの物理コアを16コアと認識してしまっているせいでキャッシュの扱いがおかしくなっているという話があるみたい
本当なのかね?

471 :Socket774:2017/03/05(日) 14:55:43.63 ID:LbimSZFG
認識ミスは、OS/BIOS/ドライバ等のアップデートで修正されるかな?
Windows10はちゃんと修正されたとして、7をつかってる人はどうなるんだろ

472 :Socket774:2017/03/05(日) 15:02:59.01 ID:E5FMVhm0
ドライバで治るなら、大慌てでMSに対応ドライバを提供している頃か、認証されて出てくるまで1週間くらいかね
しかし、そういうのは発売前にやっとくもんじゃあないのか、まさか気が付かなかったなんてことはないはずだし

473 :Socket774:2017/03/05(日) 16:44:00.67 ID:78KQ2FmL
MSのサイトから落とせるCoreinfoってソフト使うとWindowsがどうCPUを認識してるか分かるから持ってる人は使ってみるといいんじゃね
仮想CPUと物理CPUの対応とかどのコア同士がキャッシュを共有してるかとか表示されるから

474 :Socket774:2017/03/05(日) 17:13:30.78 ID:EeCtDGEG
Ryzenはまだ速くなる可能性があるってことか…?

475 :Socket774:2017/03/05(日) 18:49:53.93 ID:m/l1CYNA
まだ最適化されていない感じはするな

476 :Socket774:2017/03/05(日) 19:01:06.69 ID:4af8Nhld
OSからの正確な認識
BIOSのメモコン周りとその他の最適化
x26xの最適化

3段階の変身を残してる

477 :Socket774:2017/03/05(日) 19:17:32.07 ID:58Cl3U7f
最強の進化はZEN2と呼ばれる
7nm製造プロセスで多方面に飛躍的に強化される

478 :Socket774:2017/03/05(日) 19:24:39.71 ID:78KQ2FmL
Coreinfo使った人が記事書いてた
https://www.riscascape.net/archives/11395
ちゃんと8物理コア16論理コアでL3が8論理コアごとに8MBずつ割り当てられてると認識されてるから正しく認識されてるね

479 :Socket774:2017/03/05(日) 20:09:18.05 ID:lfEZHYLf
>>470
そいつのマザボのBIOSがおかしいんじゃね

480 :Socket774:2017/03/05(日) 21:03:06.33 ID:tjkyZcZu
>>460
x264やx265はgpuも使って高速化しようってプランはないの?

481 :Socket774:2017/03/05(日) 21:15:44.42 ID:4af8Nhld
-openclがあるじゃん

gpu使うったって並列で出来るものばかりじゃないから結局はcpuと互いに結果待ちしたり
メモリも共有じゃないから一々互いにコピーして結果書き戻してオーバーヘッドが発生して思った程速くならない

482 :Socket774:2017/03/05(日) 21:51:04.97 ID:skMfVkZX
>>450
ありがとう

483 :Socket774:2017/03/05(日) 21:56:07.10 ID:BCSqmgrF
>>480
x265についてはAMDも研究中
来年以降にHBM付きハイエンドAPUでも出ないと
最終的にモノにはならないもよう(現在だとGPGPUをいくら上手く使ってもCPUのみでしたほうが早い)

484 :Socket774:2017/03/05(日) 21:58:27.82 ID:6p44PRAk
【CPU】Ryzen 7 1700@定格
【MEM】DDR4-2400 4GBx2
【M/B】ASRock AB350 Gaming K4
【GPU】MSI R9 390 Gaming 8G
【SSD】SanDisk Ultra II 480GB
【OS】 Win10 pro x64
---------------
【x264】r2744 (x64)

【Veryfast】 84.19 fps, 33405.22 kb/s
【. Medium】 27.80 fps, 34733.47 kb/s
【   Slow】 16.70 fps, 34761.34 kb/s
【. Slower】 6.34 fps, 34089.92 kb/s

--opencl
【Veryfast】 87.65 fps, 33403.72 kb/s
【. Medium】 29.10 fps, 34713.13 kb/s
【   Slow】 17.03 fps, 34680.62 kb/s
【. Slower】 6.40 fps, 33985.16 kb/s

FX8120からの乗り換えなのでこれで満足です。
これでTimeSpyが4274でした。

485 :Socket774:2017/03/05(日) 22:23:35.55 ID:cMidllvz
https://forums.anandtech.com/threads/ryzen-strictly-technical.2500572/page-9#post-38776310
こういう話があるみたい。

OSのスケジューラーがCCXで構成されているRyzenに対してうまく最適化されていないおかげで、
CCX間でスレッドのシャッフルみたいなことが起きちゃっているようだ。
CCXは、SMPとほとんど同じノリみたいで、2CPUなXeonでも同じような現象が見られたりするようで、
上のリンク先にあるように、ゲームみたいなマルチスレッド化があまり進んでいないアプリだと
CCXを1つ無効にした方がパフォーマンスが向上すると言ったことが起きている。

エンコーダーの場合、マルチスレッド化はゲームより全然進んでいるけど、Ryzenの場合、
512bitのAVX2を256x2で処理しているわけだから、上記の部分でうまく機能していないのかもしれない。

486 :Socket774:2017/03/05(日) 22:27:12.87 ID:VG56LEk2
RYZENは発売前と後でイロイロ言われてるけど結局一番の指摘点はモデルナンバーと価格差のメリットが無い事だな

487 :Socket774:2017/03/05(日) 22:37:51.55 ID:BCSqmgrF
>>484
お、1700レビューthx
基本的にクロックの高い1800Xと比べたら見劣りするけど普通に早いね
ついでにx265エンコ結果も知りたいッス

488 :Socket774:2017/03/06(月) 01:25:55.40 ID:Y2nUD0r4
>>484
クロック低い割に速いなぁ
これでもHaswell全コア3.7GHzの1.7倍速だわ
もしも可能なら全コア3.7GHzくらいの軽OCの結果も見てみたい

489 :Socket774:2017/03/06(月) 01:41:56.43 ID:TJbtMYBc
今度こそ1090Tから乗り換える
>>331くらいから>>484になるのか・・・楽しみすぎる

490 :Socket774:2017/03/06(月) 01:48:47.00 ID:4yrjOZmP
全種ロックフリーで耐性が1800Xも1700も変わらん
1700ウマー

491 :Socket774:2017/03/06(月) 01:59:15.09 ID:ttIZBxqD
電圧と爆熱に気を付けろよ

492 :Socket774:2017/03/06(月) 02:58:07.48 ID:hIn+MZZ6
>>485
512bitはAVX512じゃないの
それにRyzenは128bitまでしか対応していないよ

493 :Socket774:2017/03/06(月) 23:31:48.12 ID:3NupAhtv
>>484
x265やってみました。

【CPU】Ryzen 7 1700@定格
【MEM】DDR4-2400 4GBx2
【M/B】ASRock AB350 Gaming K4
【GPU】MSI R9 390 Gaming 8G
【SSD】SanDisk Ultra II 480GB
【OS】 Win10 pro x64
---------------
【x265】2.1+70 (x64)
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

FHD
【Veryfast】 38.44 fps
【. Medium】 20.32 fps
【   Slow】 8.67 fps

電源オプション等のOSの設定はデフォルトのままです。
エンコ中はタスクマネージャ読みで3.15〜3.18GHzで動いてます。
OCは今週末にでも出来たら上げます。

494 :Socket774:2017/03/07(火) 00:41:00.58 ID:2m9b8qqJ
RyzenはAVX2無効にするために-asm AVXで測った方が速いと思う

495 :Socket774:2017/03/07(火) 09:33:29.83 ID:qsbIeBu4
>>493
乙thx
ターボクロックが割と低めな気がするけど
クーラーはなに使ってるの?

496 :Socket774:2017/03/07(火) 15:35:10.60 ID:5NdOO468
エンコはどうなんだろう

【AM4】 AMD Ryzen 7/5/3 Part12 【Summit Ridge】 [無断転載禁止]©2ch.net
http://potato.2ch.net/test/read.cgi/jisaku/1488676197/818

818 名前:Socket774 (ワッチョイ 6be2-9ant)[] 投稿日:2017/03/05(日) 17:04:48.76 ID:bnmRNaF/0
twitterで流れてたけど、ドイツのglemってサイトがMSIマザーボードのbios
を117にアップデートしたら4〜26%パフォーマンスアップ(平均17%)したとか
言ってるらしい。
https://www.golem.de/news/ryzen-7-1800x-im-test-amd-ist-endlich-zurueck-1703-125996-4.html

computerbase.deはmsiの117でベンチ取ってるようだ。
https://www.computerbase.de/2017-03/amd-ryzen-1800x-1700x-1700-test/2/

ゲームベンチ見ると大分マシになってる感が。DX12はまだ最適化不足らしいけど。
https://www.computerbase.de/2017-03/amd-ryzen-1800x-1700x-1700-test/4/

497 :Socket774:2017/03/07(火) 17:55:00.73 ID:wHbqdXMF
ほぼ100%で動いてるから影響ないんじゃないの

498 :Socket774:2017/03/07(火) 21:32:49.60 ID:Hli3MbTa
ゲームは7と10で同じ消費電力でスコアが違うみたい
Ryzenの7での報告はまだないな

499 :Socket774:2017/03/07(火) 23:46:18.66 ID:tvPo/aEL
でも7はサポートしないんでしょ?

500 : 【小吉】 :2017/03/08(水) 00:02:23.91 ID:uZsx2pGB
Five hundred

501 :Socket774:2017/03/08(水) 00:12:13.42 ID:7FUp7zO2
>>499
ドライバを用意してるところもあるそうだ

502 :Socket774:2017/03/08(水) 01:56:55.13 ID:bo14ijAZ
>>499
win7もサポートしてる
海外でwin7の方がゲームでfps出たって報告もある
BIOS腐ってるだけかも知れないが

503 :Socket774:2017/03/08(水) 04:40:02.96 ID:bhQliwEJ
Naplesはよ

504 :Socket774:2017/03/08(水) 23:45:27.34 ID:qqDh5RDi
☆x264
【CPU】Core i3-4170@定格[エンコ時3.7GHz]
【MEM】DDR3-1600-4GB x4[DC](9-9-9-28 2T)
【M/B】B85M-G Rev 1.01 BIOS:2501
【GPU】Intel HD Graphics 4400(iGPU)@定格[UMA 1024MB] + 15.36.33.4578 *OpenCL不可
【HDD】CSSD-S6T128NHG6Q[HG6y](SSD, 128GB, SATA3)
【OS】7P64SP1
---------------
【x264】r2334 8bit x64/x86

【Veryfast】31.61 / 29.53
【. Medium】8.39 / 7.51
【   Slow】3.86 / 3.58
【. Slower】1.86 / 1.56

---------------
【x264】r2665 8bit x64(HTT:Off)/x86

【Veryfast】31.95(26.77) / 29.70
【. Medium】8.48(7.04) / 7.57
【   Slow】3.91(3.35) / 3.59
【. Slower】1.86(1.61) / 1.54

いまさらHaswellのi3
エンコ時77-79(HTT:Off時69-72)w

505 :Socket774:2017/03/08(水) 23:47:54.78 ID:qqDh5RDi
☆x265
【CPU】Core i3-4170@定格[エンコ時3.7GHz]
【MEM】DDR3-1600-4GB x4[DC](9-9-9-28 2T)
【M/B】B85M-G Rev 1.01 BIOS:2501
【GPU】Intel HD Graphics 4400(iGPU)@定格[UMA 1024MB] + 15.36.33.4578 *OpenCL不可
【HDD】CSSD-S6T128NHG6Q[HG6y](SSD, 128GB, SATA3)
【OS】7P64SP1

【x265】2.1+70
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2

・x64 FullHD(HTT:OFF)/x64 4k/x86 FullHD
【.Veryfast】15.10(12.58) / 3.98 / 7.36
【. Medium】7.51(6.52) / 1.77 / 4.11
【.  Slow】3.03(2.68) / 0.72 / 1.90
 75-81w(71-72w)

Ryzen欲しいけど、7だとMSの嫌がらせが心配で安心して使い続けられそうにないんだよね

506 :Socket774:2017/03/08(水) 23:55:44.36 ID:6kVw1kPA
Ryzen関係ない話なんじゃ

507 :Socket774:2017/03/09(木) 14:56:55.94 ID:L9BFlkG3
>>502
窓7はサポート外とM$は公式発表したようだが?

508 :Socket774:2017/03/09(木) 18:38:47.03 ID:/W0oYbuP
x265<br>
【CPU】Core i7-4790K 4.6GHz (常用OC)
【MEM】DDR3 1600MHz 8GBx2x2
【M/B】ASUS Z97-C
【GPU】GTX 970 微OC
【SSD】SanDisk Extreme PRO 480GB
【OS】Win10 Pro x64
【x265】2.3+17 VS2017 PGO
【拡張命令】MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
https://www.dropbox.com/sh/qccqo3rs6dv82dk/AACLKhYhwoh30Xp8-ricnBJVa?dl=0

FHD
veryfast 37.09 fps
medium 19.24 fps
slow 7.80 fps

Ryzen 7 1700 定格よりも遅いのか...

509 :Socket774:2017/03/09(木) 21:13:46.30 ID:Ry0RovGA
>>508
そりゃ8コアやで勝てるわけない

510 :Socket774:2017/03/10(金) 01:30:25.00 ID:Zyx7F3QF
8コアでも定格ならTDP65Wのエントリーモデルでしょうw

511 :Socket774:2017/03/10(金) 13:56:41.40 ID:luQXhlED
>>510
そりゃ8コアやで勝てるわけない

512 :Socket774:2017/03/10(金) 16:06:07.25 ID:LQcXy/DR
x265はRyzenだとAVX無印の方が速いと聞いたので、AVX用にビルドを最適化してみた
--asm AVX オプションを使ったときに通常版より速い
根本的にはソースの最適化を待つことになるんだろうけど…

https://www.dropbox.com/sh/qccqo3rs6dv82dk/AACLKhYhwoh30Xp8-ricnBJVa?dl=0
x265~~Ryzen.zip

513 :Socket774:2017/03/10(金) 17:42:15.13 ID:tCNcFjP7
AVXの方が速いのではくSSEの方が速い
x264、x265は整数演算主体なので浮動小数点演算メインの
AVXはあまり使われてない
そうなると--asm AVXにすると結果的にSSEメインで計算されることになる

>>134-135を見るとわかると思う

514 :Socket774:2017/03/10(金) 17:44:32.22 ID:tCNcFjP7
つまり--asmオプション無しで実行すると
SSE整数演算の代わりにAVX2整数演算のルーチンが
使われてしまってSSEが速いと推測されるRyzenの強みが活かせないってところだろうね

515 :Socket774:2017/03/10(金) 17:50:32.37 ID:tCNcFjP7
>>134を見てわかるように
x265のアセンブラルーチンは
・AVX2まで使えるCPU用
・SSE4.1まで使えるCPU用
実質2ラインをメインターゲットに開発されてきたんじゃないかと推測される
だからRyzen用にはSSE4までに最適化されてるといいのかも

516 :Socket774:2017/03/10(金) 18:46:40.82 ID:tMhgXZFH
>>515
そうだったんですね…
134-135を見て納得しました

517 :Socket774:2017/03/10(金) 19:54:03.12 ID:oVvur0qw
上でWindowsのコアの認識がおかしいと言う話があったけどそれに似たような話
http://pc.watch.impress.co.jp/docs/news/1048913.html

518 :Socket774:2017/03/10(金) 20:54:53.76 ID:Cb3Sjr5Y
>>512
コマンドライン教えて

519 :Socket774:2017/03/10(金) 21:02:45.75 ID:tMhgXZFH
>>518
通常のx265エンコードのコマンドに
--asm AVX
を追加する

520 :Socket774:2017/03/10(金) 21:09:17.79 ID:Cb3Sjr5Y
>>519
thx!
それでコントロールできるのね

521 :Socket774:2017/03/10(金) 22:02:07.37 ID:P5LomqT6
>>484

【CPU】Ryzen 7 1700@定格
【MEM】DDR4-2400 4GBx2
【M/B】Asrock AB350 Gaming K4
【M/B】R9 390
【SSD】SanDisk Ultra II 480GB
【OS】 Win10 pro x64
---------------
【x264】r2744 (x64)
Ver1.42@3.0GHz SMT on
【Veryfast】 84.71 fps, 33405.22 kb/s
【. Medium】 26.39 fps, 34733.47 kb/s
【   Slow】 16.31 fps, 34761.34 kb/s
【. Slower】 6.27 fps, 34089.92 kb/s
Ver1.42@3.0Ghz SMT off
【Veryfast】 71.28 fps, 33314.48 kb/s
【. Medium】 21.74 fps, 34596.80 kb/s
【   Slow】 13.02 fps, 34626.93 kb/s
【. Slower】 5.52 fps, 33931.72 kb/s
Ver1.42@3.3GHz SMT on
【   Slow】 16.85 fps, 34761.34 kb/s

βbiosで色々出来るようになったので測り直してみました。
3.3Gだとh264.exeがランダムに落ちることがあって不安定でした。
温度はRyzen Master読みで60度ぐらいなので問題ないと思いますが。
定格のslowだとCPU使用率が80%ぐらいしか上がらないしOSパッチ待ちかな?

522 :Socket774:2017/03/10(金) 23:04:36.34 ID:Cb3Sjr5Y
>>519
ってエンコードのオプションの話なのね・・

523 :Socket774:2017/03/10(金) 23:09:17.59 ID:Cb3Sjr5Y
>>521
--pmode --pme を付けてみたらどうなる?

どちらもマシンパワーを使い切れない時に使うといいらしい

524 :Socket774:2017/03/11(土) 00:55:15.43 ID:4/bAPOCI
>>512のバイナリを使ってx265の拡張命令の効き具合を調べてみた
プリセットによって最速となる条件が異なるという複雑怪奇な結果にw
x264と違ってAVX2を使っても特別遅くなることはないみたい

【CPU】RYZEN R7 1800X@3.9GHz
【x265】 2.3+17 (x64)

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【Veryfast】 50.00 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT
【Veryfast】 50.84 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3
【Veryfast】 50.69 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【Veryfast】 50.99 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【Veryfast】 49.71 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【Veryfast】 49.31 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1
【Veryfast】 49.20 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【. Medium】 26.53 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT
【. Medium】 26.65 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3
【. Medium】 26.56 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【. Medium】 26.58 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【. Medium】 26.34 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【. Medium】 26.14 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1
【. Medium】 26.12 fps

【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT BMI2
【   Slow】 11.32 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZCNT
【   Slow】 11.21 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3
【   Slow】 10.95 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2
【   Slow】 11.16 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2 AVX
【   Slow】 11.15 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.2
【   Slow】 10.99 fps
【拡張命令】 MMX2 SSE2Fast SSSE3 SSE4.1
【   Slow】 11.19 fps

525 :Socket774:2017/03/11(土) 09:02:41.62 ID:W1A0dqHj

AVX2の有無より
SSE4とAVXとの違いのほうが参考になった

526 :Socket774:2017/03/13(月) 18:18:26.31 ID:51ONizOP
>>524
ネット上の記事読んで、AVX2は無効のほうがいいのかと思ったけれど
単体で走らせると遅くなるってこともないんだね

527 :Socket774:2017/03/13(月) 20:00:41.53 ID:T4PKEpiU
ほんとだ改めて見るとx265単体でのペナルティは無いのね

528 :Socket774:2017/03/13(月) 20:08:07.22 ID:kKKYGwhD
ミデアムが実用範囲に入ってスロウは保存用には良いね。

529 :Socket774:2017/03/13(月) 23:07:56.50 ID:IeZGVET7
AVX2で強化されたのって浮動小数点数演算の方だから整数演算のx264、x265はほぼ関係ないんじゃないの??

530 :Socket774:2017/03/13(月) 23:44:00.72 ID:51ONizOP
>>529
>>134-135 の結果を見ると、x264はあまり効果無いみたいだけど、x265は結構効いてるみたい

531 :Socket774:2017/03/14(火) 00:23:09.29 ID:kp4lYQHk
>>529
違うよ
AVXが浮動小数点演算メイン
AVX2が整数演算へ拡張

532 :Socket774:2017/03/14(火) 03:20:45.65 ID:sIwnd2SL
256bitや512bitの整数演算が必要なケースも殆ど無いしな
H264/H265で16bit整数演算で済むのはデコード全般とエンコードの基本部分で
x264やx265の高画質化は、処理の効率化(能率を考えた省略)とか、コア部に放り込むのに、どういう前処理を施すかとかで
その部分が必ずしも16bit整数演算で済むわけじゃ無いのだけれどな

533 :Socket774:2017/03/14(火) 03:50:36.00 ID:UbyFFZtM
256bit演算ってのは16bit演算が同時に16本できたり
32bit演算が同時に8本できたり、64bit演算が同時に4本できること

534 :Socket774:2017/03/14(火) 06:25:36.92 ID:P3anxrge
流石にSIMDが何なのか分かってない奴はググって、どうぞ

535 :Socket774:2017/03/15(水) 20:05:44.77 ID:G6QzM86o
H265は、デコードの規格は決まってるがエンコードの規格は決まってない
べつに整数演算でエンコードしようが浮動小数点演算でエンコードしようが、
デコーダが正常に認識できる形にさえすれば問題ない

536 :Socket774:2017/03/15(水) 20:32:12.48 ID:CuN+Isy7
間違った情報を上から目線で書くのは禁止

537 :Socket774:2017/03/16(木) 00:37:19.60 ID:vTrCIhJX
>>533
その束ねたり、分離するにも処理が必要な訳だが
その手間が拡張命令での高速化で稼いだ分との兼ね合いもある

538 :Socket774:2017/03/19(日) 23:33:15.66 ID:+v9roY7l
Avisynthとx264を同時にいくつも走らせるてるような時はAVXなど使う必要はないってことなんだろうか

539 :Socket774:2017/03/19(日) 23:49:04.10 ID:IgWGlMLs
なんでそう思ったの?
SIMD命令使わなければ倍以上遅くなるだけ

540 :Socket774:2017/03/19(日) 23:52:33.29 ID:vZGZee36
x264は散々検証されてきた通りSSE2までで十分に速いからな

204 KB
新着レスの表示

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)