46
パート1: DirectX 11ゲームとマルチコアCPUのスケーリング

アッシュ・オブ・ザ・シンギュラリティ & バトルフィールド 4

シンギュラリティの灰

Ashes of the Singularityは、DirectX 11とDirectX 12のテストに登場するため、このシリーズの重要な部分です。この最初のパートでは、DirectX 11とグラフィックハードウェアの組み合わせで、ゲームがどのように動作するかを確認します。Brad Wardell氏はGamasutraのポストモーテムで次のように述べています。

DirectX 11とDirectX 12の違いは簡単に説明できます。DirectX 11では、ゲーム内のすべてのスレッドが同時にDirectXと通信できますが、DirectX 11はGPUと一度に1つのスレッドしか通信できません。一方、DirectX 12では、ゲーム内のすべてのスレッドが同時にGPUと通信できます。 

「理論上、たとえば 10 コアの Intel Broadwell-E は、ビデオ カードが十分に高速であれば、DirectX 12 で DirectX 11 の 10 倍のパフォーマンスを実現できます。」

Ashes は実際にはクアッドコアCPUを必要とします(ただし、後ほど説明するように、デュアルコアプロセッサでも動作します)。Wardell氏のインタビューによると、これはゲームのAIサブシステムに関連しているようです。しかしながら、ハイエンドグラフィックカードに負担がかかるような解像度では、マルチコアによる大幅なパフォーマンス向上は期待できません。Wardell氏の警告を借りれば、4KではGeForce GTX 1080は「追いつくには速度が足りない」ということです。

画像

1

5

1920x1080では、10コアのサンプルが明らかに1位を獲得しています。約2%の差では1650ドルという価格を正当化できないかもしれませんが、それでも十分な差です。Intelの8コアおよび6コアのBroadwell-Eプロセッサが2位と3位を獲得し、4コアのSkylakeベースの構成は4位につけています。

グラフ上のデュアルコアの例は、パフォーマンスの大幅な低下が見られるため、特に注意が必要です。これらのCPUはハイパースレッディングを無効にした状態でテストしていることに留意してください。実際の構成と比較する場合、この機能は大きな違いを生むでしょう。この実験でCore i3を使用しているからといって、結果が実際のCore i3を反映しているわけではありません。実際には、HTテクノロジーを有効にすると、はるかに高い数値が表示されます。むしろ、この数値は3.9GHzのPentiumで得られる数値に最も近いと言えるでしょう。

Pentium G3258をベストCPUコラムから外すよう熱心に働きかけてくださった皆様、本当にその通りでした。平均フレームレートは明確に上限が設定されており、フレームタイムチャートには画面のカクツキとして現れる急上昇が見られます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

画像

1

5

低解像度は、グラフィックスの負荷がそれほど高くないため、GPUの使用率が低く、プラットフォームのボトルネックを評価するのに最適です。しかし、パイプラインに送るピクセル数が増えると、グラフィックカードの性能が追いつかなくなります。

1920x1080から2560x1440に解像度を変更するだけで、10コアサンプルの性能差はほぼ消え去ります(約2%の差が1%未満に縮まります)。また、クアッドコアSkylake構成と比べて17%以上高速だったのが、2560x1440では8%しか高速化していません。これはGTX 1080に最も適した解像度であるため、今回の結果はより現実世界のゲームプレイに近いものとなっています。

画像

1

5

3840x2160 になると、GeForce GTX 1080 と 10 コア CPU を組み合わせる明確な理由はなくなります。実際、改造した Core i7-6950X は下から 2 番目ですが、実質的には上位 4 位は同点です。

3.9GHzのデュアルコアCPUのシミュレーションだけが明らかに異なっており、このプロセッサは1920x1080から変化がありません。これは、解像度を問わず、確固たるボトルネックとなっています。


詳細: 最高のCPU


詳細: IntelとAMDのプロセッサ階層


詳細: すべてのCPUコンテンツ

バトルフィールド4

DICEのヨハン・アンダーソン氏によると、 『バトルフィールド 4』のFrostbiteエンジンは最大8つのCPUコアで並列処理されるとのことです。しかし、2014年に行ったプレゼンテーションでは、当時のDirectXとOpenGLの実装では利用可能なCPUコアをすべて活用することは不可能であると認めていました。本シリーズの次章では、この古いタイトルにおいてMantleがパフォーマンスにどのような影響を与えるかを検証します。ただし、今回はDirectX 11環境での弊社グラフィックカードスイートによるシングルプレイヤーベンチマークを分析しています。

画像

1

5

Tashgarテストを使い始めて以来、このテストがグラフィックに左右されることは認識していました。読者からの要望を受け、発売から何年も経った今でも『バトルフィールド 4』がどのようにプレイされているかをより正確に表すマルチプレイヤー指標の作成を検討しました。しかし、DICEとのメールのやり取りを経て、一貫性があり再現可能なシナリオは実現不可能であることが明らかになりました。

そのため、ゲームが追加のホスト処理リソースを利用すると謳われているにもかかわらず(少なくともマルチプレイヤーキャンペーンでは確かにそうですが)、4コア以上ではスケーリングは全く見られません。唯一際立ったデータポイントは、シミュレーションによるデュアルコアSkylakeベースのCPUで、他のCPUよりも遅れており、100秒間の録画を通してフレームタイムがはるかに長いことを示しています。

画像

1

5

2560x1440 でのグラフィックワークロードでは、デュアルコア Intel プロセッサでも他の 4 つの構成と同程度のフレームレートの平均を記録しています。しかし、もう少し詳しく見てみると、パフォーマンスの一貫性が低く、実行時間全体にわたってフレームタイムが長くなることがわかります。それ以外の点では、すべての CPU の平均フレームレートは 1fps 以内の差しかありません。

画像

1

5

4Kへのステップアップは素晴らしいイコライザーです。Railsベンチマークでは、5つのコア構成すべてがほぼ同等のパフォーマンスを示し、フレームタイムのスパイクもそれほど多くなく、問題になることもありません。この解像度では、グラフィック処理がパフォーマンス測定における制限要因であることは明らかです。

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。