はじめに
みなさん、こんにちは。SB C&Sの加藤です。 私たちのチームでは、日本にこれから入ってくる海外スタートアップ企業やテクノロジーについて、国内市場での展開の支援をミッションとして活動しています。
本連載記事ではデータを活用するためのノウハウについてご紹介させていただきます。
==========================================================
■DataOps 第1回 「The DataOps 18の原則」 ※本記事です!
□DataOps 第2回 「2019年のDataOpsサーベイから見た課題」
□DataOps 第3回 「データ分析の8つのチャレンジ」(前編)
□DataOps 第4回 「データ分析の8つのチャレンジ」(後編)
□DataOps 第5回 「 DataOpsを実践するための7つのステップ」(前編)
□DataOps 第6回 「DataOpsを実践するための7つのステップ」(後編)
==========================================================
組織やツール、業界を超えてデータを扱う経験を通し、データ活用をよりよくしていくこと、これをDataOpsと呼びます。個人的には、Data(データ)をOps(活用する)ための、ビジネス・プロセス・組織や文化・テクノロジーのトランスフォーメーションや自動化のようなものだと考えています。
また、データサイエンス、データエンジニアリング、データマネジメント、ビッグデータ、ビジネスインテリジェンスなどと名称は様々ですが、私たちは仕事を通じてデータ活用の価値を理解するようになってきました。
データそのもの価値や活用方法に明確な答えはなく、企業や組織によって千差万別ですが、先人たちの経験の中から、データ活用をより良くするための18の原則をご紹介していきたいと思います。
DataOpsの18原則
1.顧客を満足させ続ける事
最優先事項は、数分から数週間までの価値ある分析的な洞察を早期かつ継続的に提供することで、お客様に満足していただくことです。
2.実際に使えそうな分析に重きを置く
データ分析のパフォーマンスの第一の尺度は、堅牢なフレームワークとシステムの上に正確なデータを組み込んだ、洞察力に富んだ分析がどの程度提供されているかになります。
3.変化を受け入れる
私たちは変化する顧客の要望を柔軟に受け入れる必要があります。そのため顧客とのコミュニケーションをとるうえで最も効率的な方法は、対面での会話です。
4.チームスポーツである
分析チームには、常に様々な役割、スキル、お気に入りのツール、肩書きが存在します。多様な背景や意見を持つことで、イノベーションと生産性が高まります。
5.日々の関わり方
顧客、分析チーム、オペレーションは、プロジェクト全体を通して毎日一緒に仕事をしなければなりません。
6.自己組織化
最高の分析的洞察力、アルゴリズム、アーキテクチャ、要件、設計は、自己組織化されたチームから生まれます。
7.英雄主義を減らす
分析的洞察に対する需要が増大しているため、分析チームは英雄主義を減らし、持続可能でスケーラブルなデータ分析チームとプロセスを構築するように努力すべきだと考えています。
8.振り返りを行う
分析チームは、定期的に顧客、および運用統計から提供されたフィードバックをもとに振り返りを行うことで、チームの運用方法について軌道修正を行うことが成功の秘訣です。
9.分析はコードである
分析チームは、データへのアクセス、統合、モデル化、可視化のために、さまざまなツールを使用します。基本的に、これらのツールのそれぞれがコードによって設定を記述、保存します。
10.オーケストレーション(自動化)
データ、ツール、コード、環境、および分析チームの作業の最初から最後までのオーケストレーション(自動化)は、分析を成功させるための重要な要因です。
11.再現性を持たせる
再現性のある結果が求められるため、データ、ハードウェアとソフトウェアの構成、ツールチェーン内の各ツールに固有のコードと構成など、すべてをバージョン管理します。
12.手軽で安全な環境
分析チームのメンバーが簡単に作成でき、隔離された安全で使い捨てできる環境を与えることで、分析チームのメンバーが実験を行うためのコストを最小限に抑えることができます。
13.単純さをもたせる
敏捷性を高めるために単純さ、つまり、行わない作業量を最大化する技術が不可欠です。
14.分析は製造と同じ
分析パイプラインは、リーン製造ラインに似ています。私達はDataOpsの基本的な概念が分析的な洞察力の製造の継続的な効率を達成することを目的としたプロセス思考に焦点を合わせることであると信じます。
15.品質が最も重要
分析パイプラインは、コード、構成、データの異常やセキュリティ上の問題を自動検出できる基盤を構築し、エラー回避のための継続的なフィードバックをオペレータに提供する必要があります。
16.品質とパフォーマンスを監視する
パフォーマンス、セキュリティ、品質を継続的に監視して、予期せぬエラーを検知し、運用の統計を生成することができます。
17.再利用する
分析結果を活用することで、個人またはチームによる過去の不要な作業の繰り返しを防ぐことができます。
18.サイクルタイムの改善
顧客のニーズを分析的なアイデアに変え、開発中にそれを作成し、再現可能な生産プロセスとしてリリースし、最終的にその製品をリファクタリングして再利用するまでの時間と労力を最小限に抑えるように努めなければなりません。
さいごに
上記18の原則にあるように、小さな成功体験から組織全体へのスケールするようプロセスを調整していくということが必要なんですね。果たして、こういったことが当たり前になる、データ活用が民主化された世界がくるのでしょうか???
次回以降は、DataOpsシリーズとして、データ活用に向けての具体的な課題を整理し、それらを解決するための考察や事例を紹介しながらテーマを深堀していきたいと思います。
それでは、また!
参照
本記事は、提供元の米国Data Kitchen社より許可をいただいて資料の紹介をしております。
原文をご覧になりたい方は、以下をご参照下さい。
https://datakitchen.io/dataops-cookbook-second-edition.html
他のおすすめの記事はこちら
著者紹介
SB C&S株式会社
テクニカルマーケティングセンター
加藤 学
エンタープライズ領域での開発から運用監視までの幅広い業務経験を活かし、事業開発やマーケティングチームと一緒になってビジネスの立ち上げを行っている。日本とアメリカ、特にシリコンバレーへ滞在し、新規プロダクトの発掘調査や国内外の新規パートナーリクルーティング、技術戦略、ポートフォリオの策定など、技術をバックグラウンドにしたさまざまな活動を行っている。最近では、DevOpsを始めとした開発者向けビジネスの立ち上げを行い、プロジェクトの責任者として慌ただしい日々を送っている。