みなさん、こんにちは
SB C&S 技術担当の小川です。
これまでNetAppのONTAPとオブジェクトストレージとの階層化を実現する機能であるFabricPoolについてブログで紹介してきました。
オブジェクトストレージを利用する際に、まずは手軽に試そうと思うとパブリッククラウドで提供しているオブジェクトストレージサービスの利用を考える方もいるのではないでしょうか。
しかし、これまでオンプレのインフラに従事してきた方にはパブリッククラウドサービスに不慣れな方も多いのではないかと思います(私を含め)。
そこで今回は皆様のオブジェクトストレージの利用のハードルを下げるため、Microsoft AzureのBLOBストレージを例に2回にわたりオブジェクトストレージについて紹介します。
オブジェクトストレージとは何か知るためにインターネットで検索すると様々な情報が出てきて様々な表現で説明していますが、端的に言ってしまうと「とっても広い空間にデータを分散配置するストレージ」と表現できます。これだけでは何のことだかさっぱりわからないと思いますので例を上げながら説明します。
オブジェクトストレージを説明する前に比較としてファイルサーバから振り返ります。
ファイルサーバのデータの保存方法を説明するには会社の組織名を例に上げるとわかりやすいです。
以下の部署名は私の所属する部署名(2020年6月現在)です。
弊社の部署は「事業本部」、「本部」、「統括部」、「部」、「課」という階層構造になっています。
これをファイルサーバに当てはめるとそれぞれの部門がフォルダになる階層構造となります。
そのため「2課」に配属されている「小川」を探そうと思うと階層構造なので上から順番に探す必要があります。階層が深ければ深いほど「小川」を見つけるのが困難になります。
これに対してオブジェクトストレージを例えるなら福岡Pay P ayドーム(2020年6月現在の名称)の広大の敷地に椅子を用意し、部署や職位関係なく人を座らせるようなイメージです。ただしこのままでは「小川」を探すことが出来ないので小川と椅子の番号を紐付けることで簡単に見つけることが出来ます。オブジェクトストレージに話を戻すとデータはオブジェクトという単位で管理され、オブジェクトはデータとデータを識別するIDなどを含むメタデータで構成されます。そのためファイルサーバに比べ検索が早くなります。
Microsoft Azureにおけるデータの分散配置
ここまででオブジェクトストレージのデータの保管方法を理解出来たのではないかと思います。しかし「分散配置」について疑問が残っていると思います。データの分散配置についてはそれぞれパブリッククラウドサービスのサービスレベルによって考え方が異なるため、今回はMicrosoft Azureにおける分散配置について説明します。
データの分散配置を説明する前に「ジオ」、「リージョン」、「Availability Zone(以降AZ)」という用語を理解する必要があります。
「ジオ」とはMicrosoft Azureにおける地域分類を示します。例えば「北米」や「日本」が上げられますが、必ずしも国ごとに分かれてはいません。また、ジオが異なれば提供されるサービスも異なります。
「リージョン」はAzureデータセンターを配置する地域を示します。リージョンは必ず1つのジオに属します。日本のリージョンは「東日本」と「西日本」の2つのリージョンがあります。リージョンは必ず2つのリージョンでペアで構成されています。これを「リージョンペア」と呼びます。日本においては「東日本」と「西日本」がリージョンペアとなり耐障害性や高可用性を実現します。
続いて「AZ」についてです。AZはAvailabilityと名がつく通り可用性を担保するエリアのことです。ここで言う可用性はデータセンター障害を示します。AZは1つのリージョンに対して3つ存在しています。更に1つのAZには1箇所以上のデータセンターが属しています。
これまで説明した「ジオ」、「リージョン」、「リージョンペア」、「AZ」を図にすると以下のようになります。
「ジオ」、「リージョン」、「AZ」を理解したことでMicrosoft Azureの地理的な関係が理解出来たのではないかと思います。では実際にどのようにデータを分散配置するかというと「レプリケーション」というデータ複製の概念で分散配置を行います。レプリケーションには様々な種類があります。
レプリケーション名称
概要
ローカル冗長ストレージ(LRS)
プライマリリージョン内の物理的に1つの場所で同期的に3つのデータのレプリカを作成。
ゾーン冗長ストレージ(ZRS)
プライマリリージョン内の3つのAZに同期的に3つのデータのレプリカを分散して作成。
地理冗長ストレージ(GRS)
プライマリリージョン内の物理的に1つの場所で同期的に3つのデータのレプリカを作成後、セカンダリリージョン内の物理的に1つの場所へ非同期で3つのデータのレプリカを作成(合計6つ)。セカンダリリージョンに作成されたデータは通常フェイルオーバされないとアクセスできない。
読み取りアクセス地理冗長ストレージ(RA-GRS)
GRS環境でセカンダリリージョンに作成されたデータへのリードアクセスを可能にする。
geoゾーン冗長ストレージ(GZRS)
プライマリリージョン内の3つのAZに同期的に3つのデータのレプリカを分散して作成後、セカンダリリージョン内の3つのAZに非同期で3つのデータのレプリカを分散して作成。セカンダリリージョンに作成されたデータは通常フェイルオーバされないとアクセスできない。
読み取りアクセスgeoゾーン冗長ストレージ(RA-GZRS)
GZRS環境でセカンダリリージョンに作成されたデータへのリードアクセスを可能にする。
オブジェクトストレージを使用する1つの理由として、使用方法によってストレージコストを下げることがあげられます。
例えばONTAPのSnapMirrorによる非同期レプリケーションを用いたDR環境の構成を考えてみます。DR環境の場合、受信側のONTAPは通常時操作しないことが多いため送信側のデータ量が多ければ多いほど受信側のストレージコストが上がります。
そこで受信側のONTAPでFabricPoolのAllポリシーを設定するとレプリケーションされたデータがすべてオブジェクトストレージへ移動します。
Microsoft AzureのBLOBストレージの従量課金の場合、保存容量、データの操作、データの読み込みで課金されます。そのため、DR環境ではリストアしない限り受信側のデータを操作することがないため、操作時の金額が軽減され料金のほとんどがデータ保存容量における課金となります。この金額がオブジェクトストレージでは安価となっております。実際の金額はMicrosoft Azureの公式Webサイトをご参照下さい。
今回はMicrosoft AzureのBLOBストレージを例にオブジェクトストレージの概要と利用メリットについて紹介しました。
次回はMicrosoft AzureのBLOBストレージの使用方法について紹介します。
【SB C&SNetAppプロモーションTwitterアカウント】
NetAppに関するさまざまな情報を公開しています。
皆様フォロー宜しくお願いいたします。
@sbcas_netapp_pr
TwitterアプリからはこちらのQRコードもどうぞ