
こんにちは。SB C&S の野木です。
本記事では、NVIDIA Multi-Instance GPU(MIG)とNVIDIA® Virtual GPU(vGPU)を組み合わせた技術である「MIG Backed vGPU」について紹介します。
MIGおよびvGPUについては別の記事で詳しく紹介していますので、合わせてご参照ください。
NVIDIA Multi-Instance GPU(MIG)の過去記事
第1回:NVIDIA Multi-Instance GPU(MIG)の紹介
第2回:NVIDIA Multi-Instance GPU(MIG)の設定手順
NVIDIA Virtual GPU(vGPU)の過去記事
【連載】NVIDIA vGPU ご紹介
【連載】NVIDIA vGPU ご紹介 第1回 vGPUのコンポーネント
【連載】NVIDIA vGPU ご紹介 第2回 vSphere環境でのvGPUセットアップ手順
【連載】NVIDIA vGPU ご紹介 第3回 Nutanix AHV環境へのNVIDIA GPUドライバーインストール手順紹介
【連載】NVIDIA vGPU ご紹介 第4回 vGPUはどのようにリソースを分割するのか
【連載】NVIDIA vGPU ご紹介 第5回 vGPUライセンスの仕組み
MIGとvGPUのメリット/デメリット
NVIDIAが提供するMIGとvGPUは、どちらもGPUリソースを効率的に利用するための技術です。
組織内でGPUを複数ユーザーで共有するケースや、GPU as a Service(GPUaaS)のようにGPU利用をサービスとして提供するケースなどで活用されています。
一方、MIGとvGPUにはそれぞれ特徴があり、単独で利用する場合にはメリット・デメリットが存在します。
MIGのメリット/デメリット
- メリット
- GPUを分割して複数用途へ割り当てられるため、GPUリソースを効率的に利用できる
- GPUリソースを分離して利用できるため、他処理の影響を受けにくく性能を安定させやすい
- ライセンス不要で利用可能
- デメリット
- 利用可能な分割パターンが決まっており、柔軟な細分化は不得意
- MIG単体では複数仮想マシンへの柔軟なGPU割り当てに制約がある
- GPUインスタンスの再構成時には、GPUを使うプロセスの停止が必要
vGPUのメリット/デメリット
- メリット
- GPUを複数の仮想マシンで共有利用できる
- 用途に応じて細かなGPUメモリプロファイルを選択でき、柔軟な割り当てが可能
- 仮想マシン単位でGPUを割り当てられるため、VDIなどの仮想環境で利用しやすい
- デメリット
- 仮想マシン間で負荷競合が発生する可能性がある
- 性能評価時の再現性に影響する可能性がある

このように、MIGとvGPUにはそれぞれ異なる特徴があり、単独利用では考慮すべき点も存在します。
一方で、それぞれのデメリットに着目すると、MIGとvGPUを組み合わせることで補えるケースもあります。
そこで、NVIDIAでは、それぞれの特性を活かす形でMIGとvGPUを組み合わせた機能を提供しています。
次章では、その仕組みや特徴について紹介します。
MIG Backed vGPU
NVIDIAでは、MIGとvGPUを組み合わせた機能として「MIG Backed vGPU」を提供しています。
MIG Backed vGPUの主な特徴は以下の通りです。
- ハードウェアレベルのリソース分離
- GPUワークロードの並列実行
MIG Backed vGPUでは、まずMIG技術により物理GPUを複数のGPUインスタンスへ分割し、各インスタンスに専用のDRAM、L2キャッシュ、SM(Streaming Multiprocessor)などのリソースを割り当てます。
そして、ハイパーバイザー上で各GPUインスタンスに対応するMIG対応vGPUが構成され、仮想マシンへ割り当てられます。
この構成により、vGPU上のワークロード同士が相互影響を受けにくく、同一GPU上でも安定した並列実行を実現しやすい点が大きな特徴です。

MIG Backed vGPUを利用することで、前章で紹介したMIGとvGPUそれぞれのデメリットの一部を補完できます。
例えば、MIG単体では分割パターンに制約があり、仮想マシンへの柔軟な提供が不得意という課題がありました。
その点、MIG Backed vGPUでは、MIGで分割したGPUインスタンス上にvGPUを構成し、仮想マシンへ割り当てることが可能です。
構成パターンによっては、より細かなvGPUプロファイルを利用し、仮想マシンへ柔軟に提供できるケースもあります。
また、vGPU単体では、複数の仮想マシンが同一の物理GPUリソースを共有するため、ある仮想マシンの高負荷な処理が他の仮想マシンの性能へ影響を与える可能性があります。
一方、MIG Backed vGPUでは、GPUインスタンス単位でリソースが分離されるため、仮想マシン間の負荷影響を受けにくくなります。

なお、利用可能なプロファイルや共有方式は構成パターンやGPU製品に依存します。
詳細は次章の「MIG Backed vGPUの構成」で紹介します。
MIG Backed vGPUの構成
MIG Backed vGPUには2つの構成パターンがあります。
各パターンでGPU共有方式や特徴が異なり、対応製品や制約事項にも違いがあります。
ここからは、それぞれの構成パターンについて紹介します。
MIG Backed 1:1 vGPU
「MIG Backed 1:1 vGPU」は、MIGで分割した1つのGPUインスタンスを1つの仮想マシンへ専有的に割り当てる構成です。
本記事では、NVIDIA RTX PRO™ 6000 Blackwell Server Edition(以下、RTX PRO 6000 BSE)を例に説明します。

RTX PRO 6000 BSEでは、MIG構成によりGPUインスタンスを最大4つ作成できるため、MIG Backed 1:1 vGPUを利用する場合は、最大4つの仮想マシンにそれぞれ24GBのGPUメモリを割り当てることが可能です。
各仮想マシン間では、MIG機能と同様にGPUメモリ、L2キャッシュ、SMを専有し、さらにグラフィックス処理向けのエンジンも割り当てられます。
この構成では、1つのGPUインスタンスは1つの仮想マシンへ専有的に割り当てられるため、1つのGPUインスタンスを複数の仮想マシンで共有することはできません。
サポートされるライセンスやGPU製品、ハイパーバイザーは以下の通りです。
- 必要ライセンス
- NVIDIA AI EnterpriseまたはNVIDIA vGPU Software(※vGPU Software 19.0以降)
- サポートされるGPU製品
- MIG対応GPU(NVIDIA Ampere世代、NVIDIA Hopper™世代、NVIDIA Blackwell世代の一部製品)
- サポートされるハイパーバイザー
- VMware vSphere(※8.0 U3以降)
- KVM for Linux
- Red Hat Enterprise Linux with KVM(RHEL with KVM)
- Ubuntu KVM
仮想マシンに割り当てられる最大数およびGPUメモリ容量は、各GPUのMIGプロファイル構成に依存します。
各製品の詳細なプロファイル構成については、NVIDIA公式ドキュメント(vGPU Types Reference) をご参照ください。
MIG Backed Time-Sliced vGPU
「MIG Backed Time-Sliced vGPU」は、MIGで分割した1つのGPUインスタンスを複数の仮想マシンで共有する構成です。
MIG Backed 1:1 vGPUと同様に、RTX PRO 6000 BSEを例に説明します。

本記事で例として使用しているRTX PRO 6000 BSEでは、最小2GBのvGPUプロファイルを利用できます。
そのため、1つのGPUインスタンス内に複数の仮想マシンを配置し、GPUリソースを共有することが可能です。
同じGPUインスタンス内の仮想マシンはタイムスライス方式でGPUを利用し、デフォルトではラウンドロビン方式によってGPU実行時間が割り当てられます。
一方で、GPUインスタンス間ではMIGによるリソース分離が維持されるため、他のGPUインスタンスへ割り当てられたGPUメモリ、L2キャッシュ、SMなどのリソースを消費することはありません。
サポートされるライセンスやGPU製品、ハイパーバイザーは以下の通りです。
- 必要ライセンス
- NVIDIA vGPU Software(※vGPU Software 20.0以降)
- サポートされる製品
- NVIDIA RTX PRO™ 6000 Blackwell Server Edition
- NVIDIA RTX PRO™ 4500 Blackwell Server Edition
- サポートされるハイパーバイザー
- VMware vSphere(※9.1以降でサポート予定)
- KVM for Linux
- Red Hat Enterprise Linux with KVM(RHEL with KVM)
- Ubuntu KVM
MIG Backed Time-Sliced vGPUは現時点では RTX PROシリーズの対応製品かつ NVIDIA vGPU Software 20.0以降でのみ利用可能な機能です。
導入時には、利用するGPU製品およびvGPU Softwareのバージョンを事前に確認する必要があります。
MIG Backed Time-Sliced vGPUのプロファイル
本章ではMIG Backed Time-Sliced vGPUで利用可能なプロファイルを紹介します。
MIG Backed Time-Sliced vGPUでは、GPUメモリ容量や用途に応じて複数のプロファイルが提供されています。
プロファイル名にはGPU世代や割り当てメモリ容量、用途を示す情報が含まれており、名称からおおよその構成を把握することができます
プロファイル名の見方は以下の通りです。

プロファイル名にはMIGインスタンスサイズやGPUメモリ容量、用途を示す情報が含まれています。
プロファイル名を確認することで、割り当て可能なGPUリソースを把握できます。
次にMIG Backed Time-Sliced vGPUの利用可能なプロファイル一覧は以下の通りです。

例えば、RTX PRO 6000 BSEでは、2GBプロファイルを利用した場合に最大48台の仮想マシンへGPUを提供できます。
一方で、24GBプロファイルを選択した場合は、収容可能な仮想マシン数は減少しますが、1台あたりにより多くのGPUリソースを割り当てることができます。
また、同一GPU上で異なるvGPUプロファイルを混在して利用できるため、利用者ごとのGPU要件に応じた柔軟なリソース配分も可能です。
例えば、オフィス業務向けの高集約構成から、設計業務やAI開発向けの高性能構成まで、1台のGPUサーバー上で用途に応じたGPUリソース提供を実現できます。

まとめ
本記事では、MIGとvGPUを組み合わせた「MIG Backed vGPU」について紹介しました。
MIG Backed vGPUは、MIGによるリソース分離とvGPUによる柔軟なGPU共有を両立できる技術です。
特にMIG Backed Time-Sliced vGPUでは、同一GPU上で異なるvGPUプロファイルを組み合わせることで、VDI環境からAI開発環境まで幅広いワークロードへ柔軟にGPUリソースを提供できます。
本記事が今後MIG対応GPUを活用した仮想化環境を設計する際の参考になれば幸いです。
その他のNVIDIA技術情報ブログはこちら
著者紹介
SB C&S株式会社
ICT事業本部 技術本部 第1技術統括部
第2技術部 1課
野木 空良 - Sora Nogi -
サーバー・ネットワークを中心として、AIインフラ全般のプリセールス業務に従事。
