こんにちは。SB C&Sで仮想化製品の技術支援を担当している真砂です。
今回はNutanix Files(以降Files)の保護機能の一つであるSmart DRについて紹介いたします。
Smart DRとは
Smart DRはFilesのバージョン3.8で追加された比較的新しい機能となり、以下の特徴により高いレベルのDR環境を構築することが可能になります。
- 1分間隔のレプリケーション
- 1~3分ほどでフェイルオーバーを完了
- 共有フォルダ単位の細かなレベルでレプリケーション対象を指定
- フェイルオーバー、フェイルバックの処理を数クリックで実施
このような特徴により、Filesの保護によく利用されているProtection Domainと比べ拠点災害などに対応できる、より可用性の高いファイルサーバーを提供することができます。
Protection Domainとの比較
FilesはNutanixがもつスナップショット技術を利用したProtection Domainと呼ばれる機能でデータ保護、いわゆるバックアップを取得されるケースが多いです。
以下の表でProtection DomainとSmart DRを比較します。
Smart DR | Protection Domain(Async DR) | |
レプリケーション間隔 | 最短1分 | 最短1時間 |
DRサイト切り替えに掛かる時間 | 1~3分ほど | 30分以上 |
DRサイト切り替えの実行 | 数クリックで実行 | Filesの再展開が必要 |
設定UI | Prism Centralから設定 | Prism Elementから設定 |
Protection Domainでも多くの要件を満たすことができますが、より高い可能性を求められる環境においてはSmart DRがクリティカルな要件にも対応することが可能になります。
Smart DRの設定
Smart DRの設定はすべてPrism Centralから行います。
はじめに保護対象のFilesとDR先のFiles、レプリケーション間隔を指定するポリシーを作成します。
ここでレプリケーション対象の共有フォルダを個別に指定することもできますが、Files全体を保護する場合はすべての共有フォルダを指定する場合が多いと思います。
作成したポリシーは一覧で表示されます。
ポリシー作成後、設定したスケジュールに従いレプリケーションが実行され、DR側のFilesに共有フォルダが自動的に作成されます。
なお、DRサイトで作成された共有フォルダは通常時は読み込み専用となり、フェイルオーバーを実施するまで書き込みはできません。
Smart DRの設定は以上で完了となり、非常に簡単に設定できます。
フェイルオーバーの実施
次にフェイルオーバーを実施してみましょう。
フェイルオーバーには計画内(Planned Failover)と計画外(Unplanned Failover)の2種類が存在します。
- 計画内:計画停電など予めメインサイトの利用ができなくなることが把握できる場合に利用します。
メインサイトのFiles内にあるデータと同期し、DR側のFilesが利用できる状態にします。
メインサイトのFilesは読み込み専用となり、DR側のFilesは書き込み可能な状態に変更されます。 - 計画外:災害などによってメインサイトがすでに利用不可の場合に利用します。
メインサイトのFilesはすでに利用ができないため、最後にレプリケーションしたデータにてDR側のFilesを利用できる状態にします。
メインサイトとDRサイトのFilesはどちらも書込み可能な状態になります。
計画内と計画外でこのような違いが存在しますが、いずれもDR側のFilesへ切り替える際にDNSに登録されたレコードを調整し、クライアントから接続する際はメインサイトのFilesと同名のホスト名でDR側のFilesへ接続することができます。
それでは実際にSmart DRのフェイルオーバーを実施してみます。
Prism Centralから作成したポリシーごとに現在のFilesの状態が確認でき、この表示ではメインサイトのFilesがActive状態であることがわかります。
ここで右側の「Failover」をクリックします。
フェイルオーバー時に先ほど説明した「計画内」「計画外」の2つを選択します。
今回は予想外の災害などによってメインサイトがダウンした場合に利用する「計画外(Unplanned Failover)」を選択してみます。
計画外を選択すると登録情報を調整するため、ドメインとDNSの管理者情報を入力します。
計画外のフェイルオーバーが完了すると、メインサイトとDRサイトの両方でActive状態になります。
Active状態のFilesが書き込みが可能になるため、計画外のフェイルオーバーではメインとDR両方のサイトで書き込みが可能になります。
(計画外のフェイルオーバーはメインサイトがすでに利用できない場合に利用されるため、このような仕様になります。)
メインサイトのFilesが復旧するまでは、この状態でDR側のFilesを利用することになります。
なお、DNSレコードが変更されているため、Filesへ接続するクライアントはメインサイト側に存在するFilesのホスト名を指定することでDR側のFilesへアクセスされます。
※DNSキャッシュがクライアントのPC内に存在する場合は、フェイルオーバー後もDR側のFilesへアクセスされないため注意してください。
・フェイルバックの実施
メインサイトのFilesが復旧後、フェイルバック実施の前に「Resume Replication」を選択しレプリケーションを再開します。
レプリケーションの再開時、赤枠と青枠どちらかを選択する必要がありますが青枠を選択してしまうとDR側で作成・更新したファイルが破棄されるため、基本的に赤枠を選択してレプリケーションを再開します。
また、「Create a Data Protection Policy」にチェックを入れることで、DR側にFilesで更新した内容をメインサイト側のFilesへレプリケーションさせるポリシーを自動的に作成できます。(推奨)
メインサイト側のFilesがStandby状態に変更されます。
右側の「Failback」を選択することで、フェイルバックの処理が実施されます。
また、「Create a Data Protection Policy」にチェックを入れた場合、DR側からメインサイト側のFilesへレプリケーションを行うリバースポリシーが作成されていることが確認できます。
レプリケーションの再開後、フェイルバックを実施します。
フェイルオーバー時に変更したDNSレコードをもとの状態に戻すため、再度ドメインの管理者情報を入力します。
フェイルバックを実施すると自動的に作成されたリバースポリシーは削除されます。
フェイルバックが完了すると、元の状態に戻ります。
DNSレコードは元の状態に戻っているため、クライアントはメインサイトのFilesにアクセスします。
※こちらもフェイルバック時と同様に、クライアントのPCにDNSキャッシュが残っている場合はメインサイト側のFilesにアクセスされないため、注意してください。
まとめ
FilesはNutanix上で動作するため、メインサイトの論理的・物理的な要因によって利用できなくなる可能性は低いですが、地震や水害などによって拠点そのものが利用できなくなってしまう場合、Protection Domainだとダウンタイムが長くなってしまいます。
Smart DRはProtection Domainよりも短い間隔でレプリケーションができ、フェイルオーバー・フェイルバック時の処理も自動化され短いダウンタイムで切り替えが可能です。
より高い可用性を求められる環境においてはSmart DRが必要なシチュエーションもあると考えています。
他のおすすめ記事はこちら
著者紹介
SB C&S株式会社
ICT事業本部 技術本部 第3技術部 1課
真砂 暁 - Akira Masago
お客様へより良いシステムのご提供を目標に、インフラ周りのプリセールスエンジニアとして活動。
現在は仮想化製品を担当すべく、日々精進しております。