NCP-AII対応問題集質問129：サーバーに新しくインストールされたNVIDIA AIOO Tensor Core GPUの検証を担当していただきます。GPUが正しく認識され、期待されるパフォーマンスレベルで動作していることを確認する必要があります。以下の項目を検証するため...

<<前へ次へ>>

質問 129/131

サーバーに新しくインストールされたNVIDIA AIOO Tensor Core GPUの検証を担当していただきます。GPUが正しく認識され、期待されるパフォーマンスレベルで動作していることを確認する必要があります。以下の項目を検証するための手順（コマンドとツールを含む）を説明してください。1) GPUの存在と基本情報、2) PCIe帯域幅とリンク速度、3) 負荷がかかった状態での持続的な計算パフォーマンス。

A. 1) NVIDIA の存在を確認するには「Ispci I grep NVIDIA」を、基本情報を確認するには「nvidia-smi」を使用します。 2) 帯域幅/速度を確認するには「nvidia-smi -q -d pcie」を使用します。 3) TensorFlow ResNet50 ベンチマークを実行します。 B. 1) 'nvidia-smi' を使用して、存在情報と基本情報を取得します。 2) PCIe の速度は関係ありません。 3) CUDA アプリケーションの実行中に 'nvprof プロファイラ' を実行します。 C. 1) BIOS設定でGPU検出を確認します。 2) 'Ispci -vv'を使用してPCIeの速度を確認します。 3) PyTorch ImageNetトレーニングスクリプトを実行します。 D. 1) 'nvidia-smi' を使用して、存在情報と基本情報を確認します。 2) 'nvidia-smi -q -d pcie' を使用して、帯域幅/速度を確認します。 3) CUDA ベースの行列乗算ベンチマーク (cuBLAS など) を、行列サイズを増やしながら実行し、パフォーマンスを監視します。 E. 1) 'nvidia-smi' を使用して、存在情報と基本情報を取得します。 2) 'nvlink-monitor' を使用して、帯域幅/速度を取得します。 3) GPU のボトルネックを回避するために、CPU に負荷のかかるベンチマークを実行します。

質問 129/131

コメントを発表する

Download PDF File