こんにちは。SB C&Sで九州/中国地区で技術支援を担当しています、萩原です。
Nutanixが稼動する、ホスト(サーバー)は、SSDやHDDを搭載しています。これらの領域は、仮想マシンに提供されるストレージ領域とNutanixが管理するメタデータの保存領域として利用されます。
ハイパーバイザーやCVMの構成情報は、ホストに搭載されているSSDやHDDとは別に搭載された、M.2 フラッシュ(以前のモデルはSATA-DOM)に保存されています。
この起動領域のM.2は、昨今RAID1で冗長化されたモデルも出てきましたが、M.2がシングルのモデルもまだ多く存在します。
このM.2が仮に故障すると、ハイパーバイザーのブート領域にアクセスできなくなるため、状況によってはノードダウンを起こす要因になる可能性があります。
ただし、Nutanixは、ノードダウンが発生しても、N+1ないしはN+2で構成しているため、サービスに影響はありません。
そもそも、M.2のフラッシュはSATA-DOMやHDDに比べ信頼性も高く、壊れる可能性も低いですが、ブート領域が故障した場合、交換後の復旧をすれば良いかというのは、あまり知られていない状況にあります。
今回は、ブート領域用のM.2が故障した際の復旧方法についてご紹介いたします。
今回実施する環境は以下の通りです。
ハードウェア: | HPE ProLiant DX 360 G10 ×3台 |
---|---|
AOS: | 5.20.1.1 |
ハイパーバイザー: | vSphre ESXi 7.0 Update1 |
今回は、より操作の手順を御理解頂くため、あえてvSphere ESXi環境での復旧方法をお伝えいたしますが、AHVの場合では不要な作業かどうかを分かるように記載していますので、AHVの場合のハイパーバイザー復旧の際にもお役立て頂ける情報としております。
1.復旧前に予め行っておくこと
こちらは、vSphereのみで実施する作業となります。
Nutanixの各ノードをFoundationでESXiイメージング後、仮想スイッチの増設やアップリンクNICの変更など、環境に応じてハイパーバイザーに様々な設定を入れることになると思います。Nutanixの内部(Zookeeper)で持つ構成情報は、IPアドレスなどESXiの最低限の構成情報にとどまり、Foundation後に増設した仮想スイッチなどの設定情報は保存されていません。
そのため、単純にM.2のハイパーバイザーを再インストールするだけでは、これらの設定情報が無くなってしまいますので再度設定する必要が出てきます。
そのため、予め設定が完了したESXiの設定を保存しておきます。
保存方法は、VMware社のKBに基づき行います。
(参考)ESXi ホストの構成のバックアップ方法 (2042141)
まず、TeraTerm等のSSHクライアントで、ESXiホストにログインします。
続いて以下のコマンドを発行し、ESXiホストの設定情報を保存しておきます。
vim-cmd hostsvc/firmware/backup_config
シェルに出てきたURLをブラウザで開き、設定ファイルをダウンロードします。
このファイルは、ESXiのホスト設定をリストアする際に利用しますので、大切に保管しておいてください。
2.M.2の交換
M.2のブート領域が故障した際には、保守員を手配して交換を行います。
交換されたM.2は、OSもデータも入っていない空のM.2となります。
次の手順から、この空のM.2に対してハイパーバイザーやCVMを復旧する手順を説明します。