NVIDIA A100 GPU 上に 2 つの lg.10gb MIG インスタンスを構成しました。一方のインスタンスでディープラーニングのトレーニングジョブを実行しており、もう一方の MIG インスタンスのリソースを消費しないようにしたいと考えています。ハードウェア レベルで 2 つの MIG インスタンス間の分離を保証するメカニズムはどれですか?
正解:C
MIG (Multi-lnstance GPU) provides hardware-level partitioning of the GPU. This means that each MIG instance has dedicated compute, memory, and memory bandwidth resources, ensuring strong isolation between the instances. CUDA MPS allows multiple processes to share a single GPU, but does not provide isolation. vGPU scheduling is for virtualized environments. Kubernetes resource quotas provide resource limits at the container orchestration level but do not provide hardware-level isolatiom Cgroups is a Linux kernel feature to limit, account, and isolate resource usage (CPU, memory, disk I/O, network, etc.) of process groups. It is often used in conjunction with containerization technologies such as Docker, but does not directly influence the MIG hardware partitioning.