16
Core i7-4770K:Haswellのパフォーマンスをプレビュー

結果:サンドラ 2013

Dhrystone は必ずしも実際のパフォーマンスに当てはまるわけではありませんが、AVX2 用にすでに最適化されたソフトウェアが不足しているため、Haswell の命令セットのサポートが、適切に最適化されたソフトウェアの一般的な整数パフォーマンスにどのように影響するかを知るには、SiSoftware の診断を参照する必要があります。

Whetstone モジュールは SSE3 を採用しているため、Haswell の Ivy Bridge に対する改善ははるかに漸進的です。 

サンドラのマルチメディア ベンチマークは、各ピクセルに対して 255 回の反復を使用してマンデルブロ集合フラクタルのイメージを生成し、可能な限り完全に並列に実行されるベクトル化されたコードを表します。

整数テストでは、IntelのHaswellベースのCore i7-4770KでAVX2命令セットを使用していますが、IvyおよびSandy BridgeベースのプロセッサではAVXのサポートが制限されています。赤いバーでわかるように、タスクはHaswellで大幅に高速化されています。ほぼ2倍ですが、2倍には及びません。

浮動小数点演算性能も、IntelのFMA3の最初の実装から大幅に向上しています(AMDのBulldozer設計はFMA4をサポートし、Piledriverは3オペランド版と4オペランド版の両方をサポートしています)。IvyおよびSandy BridgeベースのプロセッサはAVXに最適化されたコードパスを採用しており、同じクロックレートではかなり遅れています。

Haswellでは、なぜ倍精度型の方が浮動小数点型よりもはるかに高速化しているように見えるのでしょうか?FMA3のコードパスは実際にはレイテンシ制限を受けています。SandraのオプションでFMA3のサポートを完全に無効にしてAVXを使用した場合も、同様のスケーリングが見られます。

これら3つのチップはすべてAES-NIをサポートしており、過去のレビューから、Sandraは完全にハードウェアで実行されるため、プラットフォームはメモリから送信されるのと同じ速度で命令を処理していることがわかっています。AES256テストでCore i7-4770Kがわずかに劣勢だったのは、スループットがわずかに低いことを示しています。これは、テストシステムの初期段階によるものだと考えられます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

一方、SHA2-256のパフォーマンスは、各コアの演算性能に大きく左右されます。そのため、Haswellに搭載されたIPCの改善は、HaswellをIvy Bridgeよりも高速化し、Ivy BridgeはSandy Bridgeよりも高速化しています。

メモリ帯域幅モジュールは、暗号化ベンチマークでの結果を裏付けています。3つのプラットフォームすべてが1,600 MT/sのデータレートで動作しています。Haswellベースのマシンは少し調整が必要なようです。

昨年のIDFで議論された情報に基づき、IntelがHaswellのメモリ階層をパフォーマンス向上のために最適化したことは既に分かっています。予想通り、Sandraのキャッシュ帯域幅テストでは、32KBのL1データキャッシュによってパフォーマンスがほぼ2倍に向上することが示されています。

しかし、L2キャッシュのゲインは実際には予想よりもはるかに低くなっています。64バイト/サイクルのスループットを考えると、この数値も2倍近くになるだろうと予想していました(理論上、L2は900GB/秒以上の性能を発揮するはずです)。L3キャッシュは実際には少し低下していますが、これは独立したクロックドメインに関係している可能性があります。

エンジニアリングサンプルのCPUに何か問題があるのか​​、それともテスト側でまだ作業が必要なのかはまだ不明です。いずれにせよ、これは試作段階のチップなので、早急に結論を出すつもりはありません。