SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

高い可用性を実現するNutanix FilesのSmart DR

Nutanix
    2023.03.30

    こんにちは。SB C&Sで仮想化製品の技術支援を担当している真砂です。

    今回はNutanix Files(以降Files)の保護機能の一つであるSmart DRについて紹介いたします。

    Smart DRとは

    Smart DRはFilesのバージョン3.8で追加された比較的新しい機能となり、以下の特徴により高いレベルのDR環境を構築することが可能になります。

    1. 1分間隔のレプリケーション
    2. 1~3分ほどでフェイルオーバーを完了
    3. 共有フォルダ単位の細かなレベルでレプリケーション対象を指定
    4. フェイルオーバー、フェイルバックの処理を数クリックで実施

    このような特徴により、Filesの保護によく利用されているProtection Domainと比べ拠点災害などに対応できる、より可用性の高いファイルサーバーを提供することができます。

    Protection Domainとの比較

    FilesはNutanixがもつスナップショット技術を利用したProtection Domainと呼ばれる機能でデータ保護、いわゆるバックアップを取得されるケースが多いです。
    以下の表でProtection DomainとSmart DRを比較します。

     Smart DR  Protection Domain(Async DR)
     レプリケーション間隔  最短1分  最短1時間
     DRサイト切り替えに掛かる時間  1~3分ほど  30分以上
     DRサイト切り替えの実行  数クリックで実行  Filesの再展開が必要
     設定UI  Prism Centralから設定  Prism Elementから設定

    Protection Domainでも多くの要件を満たすことができますが、より高い可能性を求められる環境においてはSmart DRがクリティカルな要件にも対応することが可能になります。

    Smart DRの設定

    Smart DRの設定はすべてPrism Centralから行います。
    はじめに保護対象のFilesとDR先のFiles、レプリケーション間隔を指定するポリシーを作成します。
    ここでレプリケーション対象の共有フォルダを個別に指定することもできますが、Files全体を保護する場合はすべての共有フォルダを指定する場合が多いと思います。
    _2023-04-04_03-08-12_.png

    作成したポリシーは一覧で表示されます。

    ポリシー作成後、設定したスケジュールに従いレプリケーションが実行され、DR側のFilesに共有フォルダが自動的に作成されます。
    なお、DRサイトで作成された共有フォルダは通常時は読み込み専用となり、フェイルオーバーを実施するまで書き込みはできません。
    _2023-04-04_03-41-37_.png
    Smart DRの設定は以上で完了となり、非常に簡単に設定できます。

    フェイルオーバーの実施

    次にフェイルオーバーを実施してみましょう。
    フェイルオーバーには計画内(Planned Failover)と計画外(Unplanned Failover)の2種類が存在します。

    • 計画内:計画停電など予めメインサイトの利用ができなくなることが把握できる場合に利用します。
          メインサイトのFiles内にあるデータと同期し、DR側のFilesが利用できる状態にします。
          メインサイトのFilesは読み込み専用となり、DR側のFilesは書き込み可能な状態に変更されます。

    • 計画外:災害などによってメインサイトがすでに利用不可の場合に利用します。
          メインサイトのFilesはすでに利用ができないため、最後にレプリケーションしたデータにてDR側のFilesを利用できる状態にします。   
          メインサイトとDRサイトのFilesはどちらも書込み可能な状態になります。     

    計画内と計画外でこのような違いが存在しますが、いずれもDR側のFilesへ切り替える際にDNSに登録されたレコードを調整し、クライアントから接続する際はメインサイトのFilesと同名のホスト名でDR側のFilesへ接続することができます。

    _2023-04-05_01-45-30_.png

    _2023-04-05_01-45-40_.png

    それでは実際にSmart DRのフェイルオーバーを実施してみます。
    Prism Centralから作成したポリシーごとに現在のFilesの状態が確認でき、この表示ではメインサイトのFilesがActive状態であることがわかります。
    ここで右側の「Failover」をクリックします。
    _2023-04-04_03-19-10_.png

    フェイルオーバー時に先ほど説明した「計画内」「計画外」の2つを選択します。
    今回は予想外の災害などによってメインサイトがダウンした場合に利用する「計画外(Unplanned Failover)」を選択してみます。
    _2023-04-04_03-44-22_.png

    計画外を選択すると登録情報を調整するため、ドメインとDNSの管理者情報を入力します。
    _2023-04-04_03-44-48_.png

    計画外のフェイルオーバーが完了すると、メインサイトとDRサイトの両方でActive状態になります。
    Active状態のFilesが書き込みが可能になるため、計画外のフェイルオーバーではメインとDR両方のサイトで書き込みが可能になります。
    (計画外のフェイルオーバーはメインサイトがすでに利用できない場合に利用されるため、このような仕様になります。)
    _2023-04-05_02-25-32_.png

    メインサイトのFilesが復旧するまでは、この状態でDR側のFilesを利用することになります。
    なお、DNSレコードが変更されているため、Filesへ接続するクライアントはメインサイト側に存在するFilesのホスト名を指定することでDR側のFilesへアクセスされます。
    ※DNSキャッシュがクライアントのPC内に存在する場合は、フェイルオーバー後もDR側のFilesへアクセスされないため注意してください。

    ・フェイルバックの実施

    メインサイトのFilesが復旧後、フェイルバック実施の前に「Resume Replication」を選択しレプリケーションを再開します。
    レプリケーションの再開時、赤枠と青枠どちらかを選択する必要がありますが青枠を選択してしまうとDR側で作成・更新したファイルが破棄されるため、基本的に赤枠を選択してレプリケーションを再開します。
    また、「Create a Data Protection Policy」にチェックを入れることで、DR側にFilesで更新した内容をメインサイト側のFilesへレプリケーションさせるポリシーを自動的に作成できます。(推奨)
    _2023-04-05_03-27-42_.png

    メインサイト側のFilesがStandby状態に変更されます。
    右側の「Failback」を選択することで、フェイルバックの処理が実施されます。
    _2023-04-04_03-26-22_.png

    また、「Create a Data Protection Policy」にチェックを入れた場合、DR側からメインサイト側のFilesへレプリケーションを行うリバースポリシーが作成されていることが確認できます。
    _2023-04-05_03-41-43_.png

    レプリケーションの再開後、フェイルバックを実施します。
    フェイルオーバー時に変更したDNSレコードをもとの状態に戻すため、再度ドメインの管理者情報を入力します。
    _2023-04-05_03-58-27_.png

    フェイルバックを実施すると自動的に作成されたリバースポリシーは削除されます。
    _2023-04-05_04-00-56_.png

    フェイルバックが完了すると、元の状態に戻ります。
    _2023-04-05_04-05-28_.png
    DNSレコードは元の状態に戻っているため、クライアントはメインサイトのFilesにアクセスします。
    ※こちらもフェイルバック時と同様に、クライアントのPCにDNSキャッシュが残っている場合はメインサイト側のFilesにアクセスされないため、注意してください。

    まとめ

    FilesはNutanix上で動作するため、メインサイトの論理的・物理的な要因によって利用できなくなる可能性は低いですが、地震や水害などによって拠点そのものが利用できなくなってしまう場合、Protection Domainだとダウンタイムが長くなってしまいます。
    Smart DRはProtection Domainよりも短い間隔でレプリケーションができ、フェイルオーバー・フェイルバック時の処理も自動化され短いダウンタイムで切り替えが可能です。
    より高い可用性を求められる環境においてはSmart DRが必要なシチュエーションもあると考えています。

    他のおすすめ記事はこちら

    著者紹介

    SB C&S株式会社
    ICT事業本部 技術本部 第3技術部 2課
    真砂 暁 - Akira Masago

    お客様へより良いシステムのご提供を目標に、インフラ周りのプリセールスエンジニアとして活動。
    現在は仮想化製品を担当すべく、日々精進しております。