SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

こんなにあるの!? NetAppのAIソリューションを一挙大公開!!!

ストレージ / HCI
2024.04.04

みなさん、こんにちは。
SB C&S 技術担当の河村です。

昨今、テレビやインターネット、SNSなど、どこを見ても「AI」に関する情報が多く飛び交っているかと思います。
当然、AIを活用したシステムやサービスの裏には我々が専門とするITの技術が使われているため、現在のIT業界ではAIに関する知識や、それをシステムに落とし込むだけの技術力、お客様に説明する提案力が求められてきています。

AIというと、それを動かすためのアプリケーションやサービスに目が行きがちですが、膨大なデータを活用するためにはインフラ基盤も最適な製品を選択する必要があります。

そんな中、企業におけるデータ活用の重要性を昔から説き続けているのがNetAppであり、今日まで様々なAIに関するソリューションを提供しているのはご存じでしょうか?
そこで本記事では、NetAppが提供するAI関連のソリューションについてご紹介していきたいと思います。

また、本記事を第1弾として、NetAppのAIの関する情報をシリーズものとしてまとめていきたいと思います。
今回は各ソリューションの概要紹介、第2弾からはソリューションごとに詳細について深堀っていきたいと思いますので、次回以降の記事もお楽しみください。

 「NetAppのAI関連記事まとめはこちらをクリック
 
 NetApp AIPod


AIPodはNetAppとNVIDIAが共同開発したAI専用のプラットフォームです。
もともとはONTAP AIという名称で提供されていましたが、2024年の3月にAIPodへリブランドされました。
AIPodはNetAppのオールフラッシュストレージであるAFFシリーズとNVIDIA DGX BasePODで構成されており、両社によって検証が完了したリファレンスアーキテクチャです。

01.png

AIPodとして利用できるハードウェアは以下になります。
直近のアップデートでNVIDIAのDGX H100、NetAppのAFF Cシリーズがラインナップに追加されており、ワークロードや費用条件に合わせて柔軟にカスタマイズできるにようになっています。
  • ネットワーク:Cisco Nexusシリーズ
  • コンピューティング:NVIDIA DGX A100、DGX H100
  • ストレージ:NetApp AFF A400、AFF A800、A900
          NetApp AFF C400、AFF C800
AIPodでは、両社のハイパフォーマンスなハードウェアの他にNVIDIA AI Enterprise、NetApp AI Control PlaneやNetApp DataOps Toolkitといった両社が提供するAI専用のソフトウェア/ツール群もサポートしており、それらと組み合わせることでどこよりも最適化されたAIシステムを提供します。

AIワークロードに必要な大量データの活用に加え、ONTAPにもともと実装されているマルチプロトコルでのデータ運用、ハイブリッド/マルチクラウド間とのデータ連携、さらには重要なデータを保護するランサムウェア対策などのセキュリティ機能にいたるまで、NetAppの多種多様なメリットを享受することできます。

 「NetApp AIPodの詳細記事はこちらをクリック ※現在準備中

 NetApp FlexPod AI


FlexPod AIはNetAppとCiscoが共同開発したAI専用のプラットフォームです。
FlexPod AIはNetAppのオールフラッシュストレージであるAFFシリーズとCisco UCSサーバー(NVIDIA GPU搭載)で構成されており、ネットワーク部分では100Gbpsを備えたCisco Nexusシリーズが利用可能になっています。
こちらもAIPodと同様、NetAppとCiscoの両社によって検証が完了したリファレンスアーキテクチャです。

02.png

FlexPod AIとして利用できるハードウェアは以下になります。
AIPodではサポート対象外となっているA150やC250といったエントリーモデルのストレージも利用可能となっており、幅広いニーズに対応できるようになっています。
  • ネットワーク:Cisco Nexusシリーズ
           Cisco MDSシリーズ
  • コンピューティング:Cisco UCS C220 M7、C240 M7(ラック型サーバー)
              Cisco UCS X210C M7(モジュラー型サーバー)
  • ストレージ:NetApp FASシリーズ 全モデル
          NetApp AFF Aシリーズ 全モデル
          NetApp AFF Cシリーズ 全モデル
FlexPod AIのUCSサーバー上にはVMware環境が用意されており、AIPodと同様にNetApp AI Control PlaneやNetApp DataOps Toolkit、NVIDIA AI EnterpriseおよびRedHat Openshift Container PratformといったAI専用のソフトウェア/ツール群もサポートしています。
これにより、AIワークロードを実行するための強力なプラットフォームを提供します。

また、機能面においてもAIPodと同様、ONTAPの様々な機能をAIワークロードで活用することが可能です。

 「NetApp FlexPod AIの詳細記事はこちらをクリック ※現在準備中

 NVIDIA DGX SuperPOD with NetApp


NVIDIA DGX SuperPODはNVIDIAが提供するAI専用のプラットフォームです。
NVIDIA DGX SuperPODでは、データ管理基盤としてNVIDIAの認定パートナーである各ベンダーのストレージ製品をサポートしており、NetAppではオールフラッシュNVMeストレージであるEFシリーズが利用可能となっています。
これにより、InfiniBandとBeeGFSパラレルファイルシステムを利用した高速なデータアクセスが可能となり、HPC/NLPといった大規模なAIワークロードに最適なプラットフォームを提供しています。

03.png

NVIDIA DGX SuperPODとして利用できるハードウェアは以下になります。
  • コンピューティング:NVIDIA DGX A100、DGX H100
  • ストレージ:NetApp EF600
ONTAPを搭載したAIPodが実現する豊富な機能性とは異なり、NVIDIA DGX SuperPODではNetAppのEFシリーズを採用することで、シンプルかつ圧倒的なパフォーマンスに実現するハードウェア構成になっています。

 「NVIDIA DGX SuperPOD with NetAppの詳細記事はこちらをクリック ※現在準備中

 NVIDIA AI Enterprise with NetApp


NVIDIA AI EnterpriseはNVIDIAが提供するAI専用のソフトウェア プラットフォームです。
NVIDIA AI Enterpriseでは、AIに特化したフレームワークや学習済みモデル、管理ソフトウェアなどを提供し、AIシステムの維持や保護といった管理作業に関する負担を軽減することで、組織がAIの構築や活用に集中できる環境を提供します。

また、NVIDIA AI Enterpriseはソフトウェア プラットフォームであるため、クラウドやデータセンター、エッジなど様々な環境にデプロイすることが可能となっており、その中でもVMware環境(VMware vSphere with TanzuまたはVMware Cloud Foundation with Tanzu)でNVIDIA AI Enterpriseを利用する場合のデータ管理基盤として、NetAppのAFF Aシリーズをサポートしています。

04.png

VMware環境でNVIDIA AI Enterpriseをデプロイする際に利用できるハードウェアは以下になります。
  • コンピューティング:NVIDIA認定パートナーのサーバー
  • ストレージ:NetApp AFF A400、A800、A900
NVIDIA AI Enterpriseは前述したAIPodやFlexPod AIなどのAI専用プラットフォームにも対応しており、様々な環境下で合理的かつ効率的なAI開発を手助けします。

 「NVIDIA AI Enterprise with NetAppの詳細記事はこちらをクリック ※現在準備中

 NetApp Astra


NetApp AstraはNetAppが提供するコンテナ管理用のサービス群です。
NetApp AstraはCSIドライバーや永続ボリュームなどを提供し、ONTAPのスナップショットやクローン機能、データ保護/移動のためのレプリケーション機能など、豊富なデータ管理機能をKubernetes環境で実現することができます。

05.png

NetApp Astraは、提供する機能に応じていくつかのサービスに分類されます。
  • Astra Trident:Kubernetesシステムとストレージを接続するためのCSIドライバー
  • Astra Control Service:SaaSベースのKubernetesデータ管理用ソリューション
  • Astra Control Center:オンプレミス環境にインストールするソフトウェアベースのKubernetesデータ管理用ソリューション
  • Astra Data Store:Kubernetes環境用にマネージドされた共有ストレージサービス(Software-Defined Storage)
NetApp Astraは前述したAIPodやFlexPod AIなどのAI専用プラットフォームにも対応しており、Kubernetes環境に対してデータの管理、保護、移動といったNetAppが掲げるデータファブリックを実現するための協力なサービス群となります。

 「NetApp Astraの詳細記事はこちらをクリック ※現在準備中

 NetApp DataOps Toolkit


NetApp DataOps ToolkitはNetAppが提供するAI専用のデータ管理ツールセットです。
NetAppストレージに対しての専門知識がなくても、データサイエンティストやMLエンジニアにとって使いやすいデータ管理を実現するためシンプルなインターフェースを提供します。

06.png

NetApp DataOps Toolkitでは、以下の2種類のツールセットを提供しており、オープンソースとしても公開されています。
  • Traditional toolkit:汎用的な環境用のツール
  • Kubernetes toolkit:Kubernetes環境用のツール
 「NetApp DataOps Toolkitのオープンソースはこちらをクリック」

NetApp DataOps ToolkitはCLIユーティリティまたは、Pythonライブラリとして提供されており、Jupyter NotebookやKubeflowなど、AIシステム内の各ツールからNetAppのストレージに対してデータの複製やバージョニングといった処理を実行できます。

そのため、AI担当のエンジニアはインフラ部分の知識習得に時間を割く必要なく、AIの開発や活用に集中することが可能です。

 「NetApp DataOps Toolkitの詳細記事はこちらをクリック ※現在準備中

 NetApp AI Control Plane


NetApp AI Control Planeはオープンソースで構成されるAI専用のデータ管理プラットフォームです。
NetApp AI Control PlaneはKubernetes環境に対してNetAppのストレージを利用したデータ管理を提供するためのオープンソースで構成されており、AIシステムの設計に関する手間を省きます。

07.png

NetApp AI Control Planeは以下のオープンソースにより構成されています。
  • Kubernetes:コンテナの運用管理や自動化を行うコンテナ管理ツール
  • Kubeflow:Kubernetes環境用のAIワークロードを管理する統合ツール
  • Apache AirFlow:決められた順序を基に処理を実行するワークフロー管理ツール
  • Astra Trident:Kubernetesシステムとストレージを接続するためのCSIドライバー
NetApp AI Control Planeは上記の各オープンソースによって、GPUやメモリ、ネットワーク、さらにはストレージのリソース管理まで幅広くサポートすることが可能です。

また、コンテナを用いたワークスペースの作成やワークロードの投入も可能となっており、最適化されたフルスタックでのエンドツーエンドなAIシステムの管理を提供します。

 「NetApp AI Control Planeの詳細記事はこちらをクリック ※現在準備中

 まとめ             
 

今回はNetAppが提供するAIソリューションについてご紹介させていただきました。
みなさんは全てのソリューションをご存じでしたでしょうか。

もともとNetAppはデータファブリックというビジョンを通して「様々な環境下でデータを柔軟に管理する」といった目的に沿ったビジネス展開を続けていました。
さらに、最近では「インテリジェントなデータインフラ企業」を目指すという方針のもと、AIを含む様々なワークロードでNetAppを提案していくといった強い気持ちが非常に感じられます。

その結果、マルチプロトコル対応や豊富なデータ管理機能に加え、クラウド連携など多くの機能を備えてきたわけですが、新たに発生したAIという大きな波においては、新しく機能を追加するのではなく、もともと実装されている各機能をAIの環境下でもシームレス
に利用するため、プラットフォームやサービス/ツールセットを通してそれらを実現する手法を取っているように感じます。

次回からは、そんな各ソリューションの詳細について深堀っていきたいと思いますので、AI記事シリーズの第2弾を楽しみにお待ちください。


※サービスや製品の仕様ならびに動作に関しては、予告なく改変される場合があります。
※本記事は2024年3月時点の情報に基づいて作成しています。
 その後のアップデートによる仕様変更等についてはメーカードキュメントをご参照ください。


SB C&S NetAppプロモーションTwitterアカウント】

NetAppに関するさまざまな情報を公開しています。
皆様フォロー宜しくお願いいたします。

@sbcas_netapp_pr

TwitterアプリからはこちらのQRコードもどうぞ。

blog14.png

著者紹介

SB C&S株式会社
ICT事業本部 技術本部 技術統括部 第1技術部 2課
河村 龍 - Ryu Kawamura -