こんにちは。SB C&Sで仮想化製品のプリセールスエンジニアをしている笠原です。
現在、DELL EMCのストレージ製品である「PowerVault ME4024」についての連載をしております。本記事はその連載の第4回となります。
第1回 製品概要と機能
第2回 ストレージのセットアップ
第3回 vSphereの共有ストレージとしての構成手順
第4回 ADAPTについて
第5回 まとめ
今回はME4シリーズ独自のRAID方式であるADAPT(Autonomic Distributed Allocation Protection Technology)についてのご紹介です。
そもそもRAIDとはについてはこちらの記事をご覧ください。
概要
ADAPTの特長をご紹介します。
・データチャンク8本、パリティチャンク2本、ホットスペア2本分で構成される分散RAIDです
・最低12本、最大128本のディスクでディスクグループを構成することができます
・同じタイプ(同じ階層)のディスクであれば容量が異なっていても構成可能です(SSD同士、15/10k HDD同士、7.2k HDD同士)
・デフォルトでディスクグループ内で容量が最大のディスクの2倍の容量がスペア領域としてセットされます。それによってディスク2本の障害に備えます
・スペア領域はディスク全体に分散されます。それによって高速なリビルドが行えます
・ディスクグループへディスクの追加が可能です。容量の増加は即時反映されます
アーキテクチャ
ADAPTにおけるチャンクとは、データを512KiBにまとめた塊であり、実データの保存されるデータチャンク8つと、誤り検出用のデータの保存されるパリティチャンク2つの計10チャンクをまとめたものが1つのストライプとなります。つまり、ADAPTに書き込まれる実データはまず4MiB単位で分割され、パリティデータとともに10本のディスクの5MiBの領域に分割して書き込まれます。
下図はディスク12本でADAPTを構成した場合の図です。現実的ではありませんが、仮に3MiBのディスクが12本とすると、1つのディスクが縦に6つのチャンクとして分割されます。(512KiB×6チャンク×12本) スペア領域はデフォルトの2本分です。
まず、ディスク2本分のスペア領域が12本のディスクに分散されます。次に、24MiBのデータ(512KiB×48)を書き込んだとします。ADAPTでは4MiBごとに6つのストライプ(A~F)へ実データを分割します。それぞれのストライプにはパリティチャンク(P,Q)が2重書きされています。1つのストライプはデータ8+パリティ2として10本のディスクに分割して書き込まれます。
14本のディスクに対して28MiBのデータを書き込んだ場合は以下のようになります。ディスクが何本であっても最初にスペア領域として2本分が分散されることとデータ8+パリティ2であるという構成は変わりません。
データがさらに増えた場合やディスクがさらに増えた場合、また、サイズの異なるディスクがADAPTに組み込まれている場合についても同様に考えれば理解できると思います。
容量計算
次に容量計算についてご紹介します。
ADAPTはスペア領域が確保された後、80%を実データ、20%をパリティやその他の用途に使用します。よって、容量計算は以下の通りとなります。
・(全ディスクの容量の合計-容量が最大のディスクの容量×スペア本数)×0.8
全てのディスクの容量が同じでスペアをデフォルトの2本分にしている時は以下のようになります。
・ディスク容量×(ディスク本数-2)×0.8
実例を2つ挙げます。
(例1)1.2TBのディスク12本で、スペア本数をデフォルトとする時
・1.2TB×(12-2)×0.8=9.6TB
下図は実際に構成した時の管理画面です。9.5TBが使用可能となりました。
(例2) 1.2TBのディスク20本で、スペア領域をデフォルトとする時
・1.2TB×(20-2)×0.8=17.28TB
下図は実際に構成した時の管理画面です。17.2TBが使用可能となりました。
このように、大体の容量を計算することができます。結果から分かるように、多少のオーバヘッドが存在します。実際に導入する際はメーカーが提供しているツールであるMidrange Sizerを使いサイジングすることを推奨します。
障害時の挙動
ADAPTはスペア領域が2本分セットされていて、2本分のパリティデータが分散されています。よって、ディスク2本の障害の際、リビルドによりそのスペア領域2本分が使われます。リビルド完了後であればスペア領域がない状態でありますがパリティデータが2本分となりますので、そこから2本のディスク障害に耐えられるという理論になります。こちらについて検証してみました。
検証環境はSSD2本(RAID1) と1.2TBのSAS HDD18本(ADAPT)のディスクグループで構成したプールで行なっています。SSDに関してはディスクグループが異なるので検証に影響はありません。連続していないので少し分かりにくいですが、画面のうち上に(プール)Aと書かれたSASディスクは全て1つのADAPTに属しています。Sと書かれたスペアディスクが存在しますが、検証して分かる通りこちらはADAPT障害時に使われることはありません。
この状態のスペア領域をコマンドから確認すると、ADAPT Actual Spare Capacityが約2.4TB(ディスク2本分)であることが分かります。
この状態からディスクを2本抜きました。
もちろんサーバーからストレージ内のデータへのアクセスに問題はありませんでしたが、コマンドからディスクの状態を確認し、Healthに注目するとこのようにディスクの状態がフォールトトレラントではない状態となり、スペア領域が使われ始めることが分かります。
リビルドが完了した後にもう一度確認すると、以下のようにActual Spare Capacityがほぼ0になっていることが分かります。(単位がGBではなくMBであることに注意) Healthの状態を見るとフォールトトレラントとなっておりますが、スペア領域としては十分ではないのでディスクの追加や交換が推奨されています。
この状態からさらに2本のディスクを抜きます
サーバーからストレージ内のデータへのアクセスに影響はありませんでした。ディスクの再構築が開始されました。
リビルド完了後はActual Spare Capacityが0となり、Healthの状態を見るとフォールトトレラントではないままです。
この状態からさらにディスクを抜くと障害となり、サーバーからのデータアクセスができなくなりました。ADAPT外のスペアディスクが使われていないことが分かります。
今回は挙動を確かめる検証のためこのような作業を行いましたが、実際に障害が起きたときには1本であってもすぐにディスクを交換しましょう。
まとめ
以上がDELL EMC PowerVault ME4シリーズ独自の分散RAIDであるADAPTについてのご紹介でした。
色々なストレージメーカーで独自のRAID構成を組めるようになっておりますが、中身が分からないと採用する選択肢にならないと思います。ME4シリーズのADAPTはこのようにシンプルな仕組みで安全にデータ保護が行えるので、ME4シリーズを購入した際には構成してみてはいかがでしょうか。
以下のURLはADAPTについてのホワイトペーパーとなります。
その他のME4シリーズのドキュメント類は以下からご覧いただけます。
https://www.dell.com/support/home/jp/ja/jpbsd1/product-support/product/powervault-me4024/docs
ストレージの検証結果などについてはSB C&Sまでお問い合わせください。次回はまとめです。
他のおすすめ記事はこちら
著者紹介
SB C&S株式会社
C&S Engineer Voice運営事務局
最新の技術情報をお届けします!