こんにちは。SB C&S 中原です。
以前にCohesityのレプリケーションについてこちらの記事でご紹介しました。 今回はこのレプリケーションの機能を応用してDRサイトへ仮想マシンを移行する機能についてご紹介したいと思います。
Cohesityを使ったことのある方は、ターゲットクラスター側のGUIで「フェイルオーバー」というメニューがあるのをご覧になったことがあるかもしれません。保護グループ名の横に「フェイルオーバー準備完了」という表示もあります。
Cohesityではこの「フェイルオーバー」の機能を利用することで、DRサイトへ仮想マシンを移行することが可能です。本ブログではこの「フェイルオーバー」機能の利用方法や、機能を利用することでどんな結果が得られるのかをご紹介したいと思います。
まずはVMバックアップのレプリケーション
今回ご紹介するフェイルオーバー機能は、仮想マシンのバックアップを別クラスターへレプリケーションしていることが前提の機能です。 そこで今回は下図のような環境を用意しました。
今回用意した環境はCohesity バージョン6.6.0d_u1 (p7) / vSphere 7.0.2です。vSphere環境とCohesityが2組あり、プライマリサイトのCohesityクラスター(ソースクラスター)にはプライマリサイト側のvCenter Serverをソースとして登録しています。
またセカンダリサイト側のCohesityクラスター(ターゲットクラスター)にはセカンダリサイト側のvCenter Serverをソースとして登録しています。この時点ではセカンダリサイト側のvCenter Serverで管理しているVMはなく、「サイズ合計」は0Bytesになっています。
さらに以下のようなポリシーを作成しました。このポリシーは1時間ごとにバックアップを実行し、バックアップ実行ごとにターゲットクラスターに対するレプリケーションが行われる設定になっています。本ポリシーはプライマリサイトのCohesityクラスターのみに存在する状態としています。(ポリシーについてはこちらの記事をご参照ください)
このポリシーを利用してプライマリサイト側でCentOS 8の仮想マシン「centos」のバックアップを取得し、レプリケーションを実行しました。(レプリケーションの手順についてはこちらの記事をご参照ください。)
その後、バックアップとレプリケーションが1時間おきに実行されます。
Cohesityのフェイルオーバー機能とは
それではフェイルオーバー機能について見ていきましょう。
仮にプライマリサイトがダウンしてしまったとします。このような状況下でターゲットクラスターからフェイルオーバーを実行すると、セカンダリサイト側に仮想マシンをリカバリすることができます。
ここからは実際にフェイルオーバーを実行する様子をご覧頂きたいと思います。
レプリケーション先であるセカンダリサイト側のCohesity GUIで操作します。ターゲットクラスター側では以下のような表示になっています。保護グループ名の右にある「︙」をクリックし、ここからフェイルオーバーを実行します。
注意事項と設定画面が表示されます。注意事項としては、フェイルオーバー後にターゲットクラスター側で保護グループが作成されることやレプリケーションの受信が拒否されることなどが記載されています。
フェイルオーバー時、この保護グループはこのクラスター上で有効になります。この無効な保護グループがレプリケーションによって作成されていた場合、このフェイルオーバーによって、プライマリークラスター上の関連する保護グループにより作成されるレプリケーションスナップショットの受信が拒否されます。フェイルオーバーの一環として、このクラスター上にあるスナップショットからVMを回復できます。回復されるVMが置かれるソースを指定してください。 |
リカバリ先になるソースを選択します。 ソースはセカンダリサイトのCohesityに登録してあるものから選択できます。「ソースを登録」をクリックするとソースを新規に登録することも可能です。ここではセカンダリサイト側のvCenter Serverをクリックします。
次にポリシーを指定します。ここで選択できるポリシーはターゲットクラスター側に存在するポリシーですので、ソースクラスターと同じ設定のポリシーを指定したいような場合には「新しいポリシー」をクリックしてポリシーを新規作成することもできます。ここでは4時間ごとにバックアップが実行される既存のポリシー「Gold」を設定してみます。
「保護グループをフェイルオーバーして回復を続行」をクリックします。
「新しい回復」画面に遷移しますので、リカバリ先のリソースプール / データストア / VMフォルダー、回復方法などを指定し「回復」をクリックします。ここでは回復方法・回復オプションはデフォルト設定のままとしています。なお、ここではプライマリサイト側の仮想マシンがまだ起動していますので「ネットワーク」設定は未接続のままにしています。(プライマリサイトの仮想マシンの停止については後ほどご説明いたします。)
リカバリジョブが開始されます。
なお今回は回復方法として「即時回復」、回復オプション「電源の状態」として「実行」が選択されていますので、Cohesityのリカバリジョブが完了する前に仮想マシンが利用可能な状態になります。
これでセカンダリサイト側に仮想マシンが移行されました。
フェイルオーバー後のレプリケーション
Cohesityのフェイルオーバー機能を利用する上で留意したいのが、本機能はいわゆる「HAクラスター(高可用性クラスター)」とは異なるということです。一般的なHAクラスター製品では業務を待機系に切り替えるといった機能を有するものがありますが、Cohesityのフェイルオーバー機能は仮想マシンを別サイトに移行するのみで、業務の引き継ぎやHA(High Availability)を提供する訳ではありません。
Cohesityでフェイルオーバーを実行した後のプライマリサイトの状況を見てみると、フェイルオーバー前と変わらず仮想マシンは稼働していますし、バックアップも引き続き取得されています。
ただしバックアップは成功していますが、図中の赤枠の通りレプリケーションは失敗となっています。これはプライマリサイト側でバックアップ・レプリケーションが実行されたとしても、ターゲットクラスター側はレプリケーションを「拒否」するためです。
レプリケーションジョブの詳細を見てみると"Replication rejected"がレプリケーション失敗の原因であることが確認できます。
このためプライマリサイト側がまだ利用可能な状態である場合は、プライマリサイト側の保護グループを「無効」にするとよいでしょう。
プライマリサイト側の保護グループ無効化
プライマリサイト側の保護グループを無効化してみます。 プライマリサイトのCohesity GUIで保護グループ名の右にある「︙」をクリックし、「無効にする」を選択します。
なお保護グループの無効化にあたって、対象の仮想マシンを電源オフにすることも可能です。今回は「VMを非アクティブにして電源をオフにする」をクリックしてみます。
vSphere側で対象の仮想マシンがパワーオフされます。
保護グループを無効にした後、プライマリサイト側のCohesityではバックアップもレプリケーションも実行されなくなります。
フェイルオーバー後のバックアップ
フェイルオーバー後、ターゲットクラスター側でバックアップを実行することができます。
ここからはセカンダリサイト側のCohesity GUIで操作します。 本記事の冒頭でプライマリサイトからセカンダリサイトのCohesityへレプリケーションを行いました。このレプリケーションによって、セカンダリサイト側のCohesityには保護グループが作成されていますが、フェイルオーバー実施後はレプリケーションを拒否するため新たなジョブ実行の記録はありません。
セカンダリサイト側でこの保護グループを利用してバックアップを取得することが可能です。保護グループ名の右にある「︙」をクリックし、「編集」を選択します。
オブジェクトには仮想マシンが何も指定されていない状態になっていますので、ペンのアイコンをクリックして仮想マシンを指定します。
ポリシーにはフェイルオーバー実行時に指定した「Gold」が設定されています。ここではこのまま変更はせず「保存」をクリックします。
これによりセカンダリサイト側でバックアップが再開されるようになりました。
しばらく時間をおいてジョブ実行状況を確認すると、図中の赤枠内の通り、ポリシー「Gold」の設定内容に沿って4時間おきにバックアップが実行され、レプリケーションは行われていないことが確認できます。
以上で、仮想マシンをセカンダリサイトに移行し、セカンダリサイト側でバックアップ取得を再開することができました。
Cohesityのフェイルオーバー機能ではこのようにレプリケーションされた仮想マシンのバックアップを利用しセカンダリサイト側で復旧させることが可能です。またフェイルオーバー実行後はプライマリサイトからセカンダリサイトへのレプリケーションは拒否されますので、セカンダリサイト側のCohesityでバックアップデータが2系統混在してしまうといったリスクを回避することもできます。
また、本記事では1つの仮想マシンのみで動作の様子をご紹介しましたが、有事の際に多数の仮想マシンをセカンダリサイトに移行したいといったご要望もあるかもしれません。そういった場合にはフェイルオーバー機能を応用したRunbookの利用が便利です。またの機会にこちらの機能もご紹介できればと思います。
※ サービスや製品の仕様ならびに動作に関しては、予告なく改変される場合があります。
※ バックアップ・リカバリの所要時間、データ削減率等は環境によって異なります。
※ 本ブログにおけるCohesityに関する記載はバージョン6.6.0d_u1(p7)の情報に基づいています。 後継バージョンにおけるサポート範囲 / 仕様変更等についてはメーカードキュメントをご確認ください。
※ Cohesity、Cohesityのロゴ、SnapTree、SpanFS、DataPlatform、DataProtect、Helios、およびその他のCohesityのマークは、米国および/または海外におけるCohesity, Inc.の商標または登録商標です。
Cohesity社ウェブサイト: https://www.cohesity.com/ja/
これまでに投稿したCohesity関連のブログ一覧はこちら
著者紹介
SB C&S株式会社
ICT事業本部 技術本部 第1技術部 4課
中原 佳澄