SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

【連載/Cohesity】【プロローグ】セカンダリストレージとは

データマネジメント
2019.08.05

みなさん、こんにちは。
SB C&S 熊谷です。

今回からセカンダリストレージという比較的新しい市場領域において、現在、非常に勢いのあるベンダーであるCohesityについて複数回にわたってご紹介をしていきたいと思います。

増加し続ける世界のデータ量

まず、Cohesityそのものやセカンダリストレージについて話題を進める前に、改めて現在の世界のデータ増加率について触れておきたいと思います。

本サイトの読者のみなさんは既にご認識いただいていることかとも思いますが、現在世界のデータは爆発的に増加し続けています。ある調査会社の報告レポートによると、その量は2025年には全世界のデータ量が約175ZB*(ゼタバイト)にも達する見込みとも言われています。
同レポートでは、本ブログ執筆時点での2019年のデータ量が約40ZB(ゼタバイト)として報告されているため、昨今のIT市場における感覚としても比較的安易に予想されることでもありますが、かなりの増加率でデータが増え続けていくことが予測されています。

IDC_DataSphere_resize.png

*1ZB(ゼタバイト)は、10億TB(テラバイト)に相当するデータ容量です。

また、世界的にもあらゆるデバイスがネットワークに繋がれるIoT市場の成熟と進化により、2025年に生成される175ZB(ゼタバイト)のデータのうち約30%ものデータが「リアルタイム」に生成される性質のデータとなることも合わせて報告されています。そのため、IT管理者としては爆発的かつ突発的に増え続けるデータをどのように管理・保護すべきかについて早急に検討する必要に迫られています。

セカンダリストレージとは

ここからいよいよ今回の本題であるセカンダリストレージについて説明をしていきたいと思います。世界のデータ量が爆発的に増加した結果、2025年には175ZB(ゼタバイト)にまで膨れ上がると先述しましたが、ひと言で175ZB(ゼタバイト)と言われてもその数値があまりにも天文学的すぎて「正直ピンとこない」というのが率直な感覚ではないでしょうか。

そこでもう少し具体的にイメージができるように、ある企業が保有しているストレージのデータ総容量として10TB(テラバイト)のデータを保有しているケースをひとつの例として考えてみたいと思います。
Cohesity 社では企業内におけるデータ性質についてミッションクリティカルな情報を扱うデータをプライマリデータ、それ以外をセカンダリデータとして分類しており、この2つのデータの割合をそれぞれプライマリが20%、セカンダリが80%として考えています。

ここで重要になってくるのが「セカンダリストレージ」という考え方です。端的にセカンダリストレージという言葉の持つ印象から考えてしまうと、例えば単純なバックアップのデータであったり災害対策用として遠隔地へ複製(レプリケーション)されたデータなどの、つまり普段はあまり使用されることなく障害発生時や災害発生時のみに緊急に使用される可能性のあるバックアップ系データと捉えられてしまうかもしれません。

しかし、現在の(比較的)新興市場として定義・認識されつつある「セカンダリストレージ」は(当然バックアップデータも含まれてはいますが)単純なバックアップデータのみではなく、企業が保有する膨大なバックアップ/アーカイブデータ、開発/テストデータ、共有ファイル/オブジェクトストレージ、アナリティクス用ビッグデータなどを総じてセカンダリデータとして定義した上で統合することのできる単一のストレージプラットフォームであるということがポイントです。

つまり、先に例をあげた保有データの総容量として10TB(テラバイト)を保有している企業では、総データ容量である10TB(テラバイト)のうち、実に8TB(テラバイト)にものぼるデータ量がセカンダリストレージに保管することのできるオポチュニティを持っていることになります。

SecondaryData.png

Cohesity DataPlatform と Cohesity DataProtect

Cohesity 社は、これらの膨大な非構造化データを単一のプラットフォームへ統合するための製品としてCohesity DataPlatform と Cohesity DataProtect というソリューションを中心に展開しています。

Cohesity_DataPlatform.png

それぞれの詳細については、次回以降のブログで説明をしていきたいと思いますが、CohesityのベースとなるCohesity DataPlatform は非常に優れた分散処理、データ効率化(重複排除/圧縮)、スナップショット機能等を有しており、ファイル共有プロトコルとしてもSMB、NFS、S3互換の複数プロトコルに対応しています。そのため既存バックアップソフトウェアサーバーからCohesity をネットワークマウントすることでバックアップデータの保存先として利用することが可能です。また、バックアップデータの保存先として利用するだけでなく、同時にSMBプロトコルを使用して通常のファイルサーバー(NAS)用途として利用することも可能になっており、Cohesity DataPlatform の優れたデータ効率化機能によってデータ容量を削減しながら企業内ファイルを統合することも可能です。

加えて、Cohesity ではCohesityData Protect と呼ばれるバックアップソフトウェアもCohesity 自身が提供しているため、Cohesity を導入するタイミングで既存のバックアップ運用から「企業内のセカンダリストレージに関わるオペレーションはすべてCohesity に統一」と運用をシンプルにすることも可能になっています。

ここまでCohesity 製品の概要について説明をさせていただきましたが、Cohesity 製品の持つ最大の特徴として、最近の潮流であるHyper Converged Infrastructure(HCI)と同じように「スケールアウトが自在に可能」という点があげられます。これまでのHCI というと、利用シーンとしてはどちらかというとプライマリ用途というイメージが多いと思いますし、実際にプライマリとして利用されている場面が多いのではないかと思います。

しかし、本ブログの冒頭でも述べたように今後もデータは爆発的かつ突発的に増加し続け、さらにその多くのデータはセカンダリデータに分類されることを考えると、セカンダリストレージにこそ「HCIライクな」考えが必要であると言うこともできるかと思います。もし、企業内のデータが事前予測よりも増えてしまったからという理由で、その度に部門ファイルサーバー(NAS)を継ぎ足し継ぎ足しで増設してしまっていては企業内データのサイロ化がますます進んでいってしまい、データの統合管理や本当の意味でのデータ利活用をすることは難しくなってしまいます。しかし、Cohesity を導入することによって、セカンダリストレージに関するこれらの課題を解決することができます。
Cohesity では、このセカンダリストレージ市場をカバーすべく非常に多くの機能を有した製品をリリースしており、現在もなおクラウド連携などの便利な機能拡張が続けられています。

次回からはいよいよCohesity の操作画面などを掲載しながら具体的な利用方法について説明したいと思いますので、お楽しみに。

Cohesity 製品紹介ページ

著者紹介

SB C&S株式会社
技術統括部 第1技術部 3課
熊谷 哲人