SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

NetApp HCI 第4回 NDE実行後のVMware vSphere環境 ― 前編

ストレージ / HCI
2019.09.17

皆さん、こんにちは

SB C&S、技術担当の小川です。

第3回ではNetApp HCIの仮想環境自動デプロイツールであるNetApp Deployment Engine(NDE)で実行される内容と設定方法を説明しました。

今回はNDE実行後のVMware vSphere環境がどのように設定されているかを説明いたします。

NetApp HCIではNDE実行後のVMware vSphereの環境を自由に設定変更しても問題ありません。ネットワークの環境も自由に変更できます。ただし、自由に設定を変更したことでうまく動作しなくなったなんてことも仮想環境において多く聞かれることです。そのため、トラブルシュートの観点からしても既存のvSphere環境を把握することは非常に重要になります。

また、NetApp HCIはVMware vSphereのライセンスをバンドルしていません。そのため使用するvSphere機能によって適切なライセンスの購入も必要になります。

なお、今回のNDEのバージョンは執筆時点での最新バージョンであるNDE 1.3.1を対象とし、vCenter Severのバージョンは6.5 update2を対象とします。
関連記事:
NetApp HCI 第1回 事前準備:ネットワーク編
NetApp HCI 第2回 NDEの事前準備その2:ノードの事前設定
NetApp HCI 第3回 NDEによるNetApp HCI環境のデプロイ

 

 NetApp HCIのvCenter Server Plug-in                                   

 

NDEによる仮想環境のデプロイを実行するとvSphere Web Clientのホーム画面に2つのプラグインがインストールされていることを確認できます。

  • NetApp SolidFire Configuration : ストレージクラスタの設定に関するプラグイン
  • NetApp SolidFire Management : ストレージクラスタの管理と操作のプラグイン

nssb3-1-1

各プラグインの役割に関する詳しい内容は今後あらためて紹介いたします

 

 VMware vSphereのライセンス                                   

  

NetApp HCIではOEMライセンスの販売はありません(2018年9月現在)。そのためNDEによるデプロイ後のvCenter ServerとESXiホストには評価ライセンスが適用されています。

  • vCenter Serverの評価ライセンス

nasb3-2-1

  • ESXiホストの評価ライセンス

nasb3-4

 

 作成されるデータセンターとクラスタ                                 

 

NDEによる仮想環境のデプロイを実施するとvCenter Serverにデータセンターとクラスタを自動で作成しESXiホストを登録します。NDEの設定項目にはデータセンター名とクラスタ名を指定する項目はないため自動で名前が設定されます。NetApp HCIの最小構成でのデータセンター名とクラスタ名は以下のようになります。

  • データセンター名 : NetApp-HCI-Datacenter
  • クラスタ名    : NetApp-HCI-Cluster-01

また、クラスタに登録されるESXiホストのホスト名はIPアドレスで登録されます

nasb3-4

 

 vSphere DRS                                       

 

NetApp HCIで設定されるクラスタには仮想マシンの配置のロードバランス機能であるvSphere Distributed Resource Scheduler(DRS)が自動で有効化されています。ただしDRSを使用するにはライセンスとして「Enterprise Plus」ライセンスが必要です。そのため、評価期間をすぎるとDRSが使用できなくなります。DRSの使用を続ける場合は評価期間内にライセンスを適用する必要があります。また、NDE実施後のDRSは以下のように設定されています。

 

DRS自動化レベル

NDE実行後の仮想環境ではDRS自動化レベルが「完全自動化」に設定されています。そのため仮想マシンはESXiホストの残りのリソースに応じて配置されるESXiホストが自動で決められます。その後もリソースに応じて自動で仮想マシンの配置を変更します。「この仮想マシンはこのESXiホストに常に配置したい」、「仮想マシン-Aと仮想マシン-Bはそれぞれ別々のESXiホストに配置したい」などの仮想マシンごとに配置の指定がある場合は仮想マシン作成後にアフィニティルールならびにアンチアフィニティルールを設定する必要があります。

 

電源管理(DPM)

DPMはDRSの拡張機能として実装されている機能で、クラスタ内のリソースがあまっていると判断された場合、特定のESXiホストから別のESXiホストに仮想マシンのvMotionを実施し、仮想マシンが動作していないESXiホストの電源を自動的にOFFにすることで消費電力を抑える機能です。

NDE実施後の仮想環境ではDPMは「オフ」になっています。

他社のHCIでは各ハイパーバイザー上に何らかのストレージコントローラ機能を搭載していることからDPMのようなハイパーバイザーの電源を切る機能を有効にすることはできません。それに対しNetApp HCIはコンピューティングノードとストレージノードが明示的に別れているためDPMを有効にすることができます。

ただし、NetApp HCIの最小構成ではコンピューティングノードが2台であり、vSphere HAが有効になっているため、この状態で1台のESXiホストの電源がOFFになると、残りのESXiホストの障害時に仮想マシンが正常に再起動しなくなります。そのため、最小構成ではDPMを有効にしないで下さい。

nasb3-4

 

 vSphere HA                                       

 

NetApp HCIで設定されるクラスタには、ESXiホスト障害時に仮想マシンを別のESXiホストで再起動する機能であるvSphere HAが自動で有効化されています。NDE実施後のvSphere HAは以下のように設定されています。 

ホスト障害時の対応

NetApp HCI環境ではESXiホストに障害が発生した際に「仮想マシンを再起動」に設定されています。これにより決められた優先順位に従って仮想マシンは別のESXiホストで再起動を実施します。仮想マシンのデフォルトの優先順位は「中」に設定されています。仮想マシンのHAに関する優先度を変更する場合は対象となるvSphereクラスタの「設定」⇒「仮想マシンのオーバーライド」で設定します。

nasb3-4

ホスト隔離への対応

ホスト隔離とは、ESXiホストに搭載されたNIC障害などにより管理ネットワークにおいてHAのマスターホストや隔離アドレス(デフォルト設定ではデフォルトゲートウェイ)と疎通が取れなくなった状態を示します。要するに『とある1つのESXiホストが管理ネットワークへアクセスが出来なく、管理上孤立している状態』と思って下さい。ホスト隔離への対応に関してNDE実行後のデフォルトの設定は「無効」に設定されています。

nasb3-4

NetApp HCIのような管理ネットワークとストレージネットワークが完全に分けられたシステムでは、管理ネットワークとは疎通が取れなくなっているが、仮想マシンネットワークとストレージネットワークは疎通が取れるという状態になる可能性もあります。このような場合、仮想マシンとしては正常に動作しているため、あえて他のESXiホストにフェイルオーバーしなくても問題ありません。むしろ無用なサービスの一時停止が起きてしまうので、HAの本来の目的とは外れてしまいます。そのためデフォルト設定の「無効」を変えずに仮想マシンの状態を確認しておくことをお勧めします。

nasb3-4

PDL(Permanent Device Loss)状態のデータストアへの対応

PDLとはESXiホストからストレージアレイへの通信はできるがLUNへのマッピングが解除されてしまっていた場合や、LUNがオフラインになるなど永続的なストレージ障害の状態を示します。PDL状態になってしまった場合にvSphere HAの機能で仮想マシンを保護するかどうか設定ができます。NDE実行後のデフォルトの設定は「無効」となっています。

nasb3-4

NetApp HCIでもPDL状態が発生する可能性は否定できません。例えばNetApp HCIのストレージノードで誤って特定のコンピュートノードのInitiator情報を削除してしまった場合、PDL状態に陥ってしまいます。そのため事前に設定を「仮想マシンをパワーオフして再起動」に設定しておけばPDL状態になっても別のESXiホストで仮想マシンが自動で再起動されます。なお、PDL状態になった場合に仮想マシンを再起動せず「イベントの発行」のみ設定することも可能です。

APD(All Path Down)状態のデータストアへの対応

APDとはESXiホストとストレージアレイとのネットワークで一時的に発生するパス障害を意味します。APD状態になってしまった場合にvSphere HAの機能で仮想マシンを保護するかどうか設定ができます。NDE実行後のデフォルトの設定は「無効」となっています。

nasb3-4

コンピューティングノードとストレージノードが明示的に別れているNetApp HCIではコンピューティングノードとストレージノード間を10Gb Ethernetで接続しています。そのためNetApp HCIでもネットワーク障害が発生するとAPD状態になる可能性は否定できません。APD状態に備え設定を変更することをお勧めします。仮想マシンを別のESXiホストで再起動するためのオプションは2つ用意されています。データストアへの接続が確率されている別ホストがあれば、仮想マシンの再起動を試みる「仮想マシンをパワーオフして再起動: 標準的な再起動ポリシー」か、常に仮想マシンの再起動を試みる「仮想マシンをパワーオフして再起動: アグレッシブな再起動ポリシー」のどちらかを仮想環境の運用に合わせて選択して下さい。なお、仮想マシンを別のESXiホストで再起動するだけでなく「イベントの発行」のみ設定することも可能です。

仮想マシンのハートビート監視

仮想マシンにインストールされたVMware Toolsからのハートビートが設定時間内に受信されなくなると仮想マシンを別のESXiホストで再起動することができます。NDE実行後のデフォルトの設定は「仮想マシンの監視」となっており、監視の間隔は「カスタム」に設定されています。

nasb3-4

アドミッションコントロール

vSphere HAによってESXiホスト障害時に他のESXiホストで仮想マシンを再起動する際に確実に仮想マシンを起動させるにはESXiホストにリソースの空きが必要になります。この空きリソースを確保することをアドミッションコントロールといいます。NDE実行後のデフォルトの設定は「無効」となっています。

nasb3-4

ESXiホストに障害が発生してしまった際、すべての仮想マシンを確実に再起動したい場合には、アドミッションコントロールを設定することをお勧めします。設定方法は様々な方法がありますが、例えばNetApp HCIの最小構成ではコンピューティングノードが2台であるため、同一のモデルでvSphereクラスタを構成するとします。このときアドミッションコントロールの設定でホストの「フェイルオーバーキャパセティの定義基準」を「クラスタ リソースの割合(%)」を選択し、CPUを50%、メモリを50%にすることでクラスタ全体の50%のリソースを確保することが出来ます。そうすることでコンピューティングノード1台分のリソースを確保することになります。

nasb3-4

ハートビートデータストア

ハートビートデータストアとは、ネットワーク機器側のNICの障害によりESXiホストが管理ネットワークにアクセスできなくなる「ネットワーク隔離」や管理ネットワーク内の通信障害によりネットワークが分断される「ネットワークパーティション」になった場合にホスト障害なのかネットワーク障害なのかを判別するために使用されるデータストアを示します。ハートビートデータストアは通常、2つ以上指定します。ハートビートデータストアのNDE実行後のデフォルトの設定は「ホストからアクセス可能なデータストアを自動に選択します」に設定されています。

nasb3-4

ハートビートデータストアには各ESXiホストの死活監視などで使用される「FDM状態ファイル」が保存されます。NetApp HCI環境のデフォルト設定ではハートビートデータストアが自動で選択されるため、仮想マシンが保存されているデータストアにFDM状態ファイルが保存される可能性もあります。仮想マシンが保存されるデータストアとハートビートデータストアを明示的に分けたい場合はこちらの設定で変更して下さい。

NDE実行後のVMware vSphereの環境についてはまだまだ続きます。

次回をお楽しみに。

 

【SB C&SNetAppプロモーションTwitterアカウント】

NetAppに関するさまざまな情報を公開しています。

皆様フォロー宜しくお願いいたします。

@sbcas_netapp_pr

TwitterアプリからはこちらのQRコードもどうぞ

Twitter_QRコード.PNG

 

NetApp HCIを知りたい方必見っ! この1冊ですべてを伝授っ!!

著者紹介

SB C&S株式会社
技術統括部 第1技術部 2課
小川 正一(VMware vExpert)