45
AMD Threadripper BIOS が間違った温度を報告していますか?

AMDのThreadripperプラットフォーム用の新しいウォーターブロックをテストしていたところ、同社のファームウェアにバグを発見しました。発売時の報道で報告された同等のウォーターブロックを使用した場合と比較して、オーバークロック時(消費電力325W)の温度測定値は、Tctl(コア温度)で最大25ケルビン、Tdie(チップ温度)で最大35ケルビンも低下しました。

これだけだと劇的な変化とは言えません。CPUを工場出荷時のクロックレート(パッケージ電力約180W)で動作させた時の値は、良質なウォーターブロック、カスタムループ、そしてはんだ付けされたIHSから期待される値と一致しているからです。Threadripperの発売当初、AMDは平均コア温度を得るためにTctl値に27℃のオフセットを加味していましたそのため、工場出荷時のクロック値が現実的な値に見えた時は満足でした。

その後、消費電力が増加すると、報告された温度が下がることがわかりました。180WではTctlは約67℃でした。しかし、325Wでは51℃(16ケルビン低い)まで低下しました。もちろん、これはアイドル時の温度出力値であり、負荷ピークが短く小さいことを考えると、あまり意味がありません。

Tdieでも同じ効果が見られました。325Wで24℃という値は意味をなさないものです。AMDのWattManもこの非常に低い値を使用しており、マザーボードも温度制御ファンの制御に同様の値を使用しています。ご想像のとおり、これはオーバークロック時に重大な問題を引き起こします。

そこで、私たちは手がかりを探し始めました。システム自体がエラーの原因ではないことを確認するため、徹底的にテストを行いました。

新旧のドライバーを搭載した新しいクリーンなWindowsイメージから始めました。最新のBIOSを使用して、異なるメーカー(Asus、Gigabyte、ASRock)の3種類のマザーボードを切り替えてみました。今のところ、報告すべきことはありません。

しかし、Asus X399 ROG ZenithマザーボードのBIOSを0503から旧0304(発売レビューで使用)に戻したところ、既に報告されている安定性の問題に加えて、再び古い温度値が表示されました。したがって、このエラーの原因はAGESAコード1003パッチ4であり、オーバークロック中に計算された温度が誤って表示され、消費電力の増加時にファンの回転数曲線が減少する可能性があると推測されます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

さらに、はるかに性能の低いAIOクーラーでテストしたところ、オーバークロックによってマザーボードのPWM制御ファンを使用した際にファン速度が大幅に低下しました。その結果、熱事故が発生する可能性が高まりました。そのため、空冷クーラーは今のところ選択肢にありません。

これらの測定値については既にAMDに報告しており、AMDからの発表、もしくは新しいBIOSのリリースを待って、アップデートに向けて再テストを実施します。現時点では、現在のBIOSバージョンをご利用の場合は、ファンを手動で制御することをお勧めします。

Igor Walllossek氏は、Tom's Hardware誌で、技術分析と詳細なレビューに重点を置いた幅広いハードウェア記事を執筆しています。GPU、CPU、ワークステーション、PCの組み立てなど、PCコンポーネントの幅広い分野を網羅しています。彼の洞察力に富んだ記事は、絶えず変化するテクノロジー業界において、読者が情報に基づいた意思決定を行うための詳細な知識を提供しています。