データサイロとは?
サイロ化の原因と問題点、3つの解消方法
データサイロは、データが組織内で孤立し、共有されない状態です。これにより、業務効率が低下し、コストが増加します。データサイロを解消することで、必要な情報に迅速にアクセスでき、より良い意思決定が可能になります。また、データの重複や保管コストを削減することもできます。
データサイロとは?
データサイロとは、データが組織から離れた独自の”かたまり”を形成し、その情報を必要とする部門に行き渡らない現象のことです。データサイロはビジネスにとってコストと時間のロスをもたらしますが、データサイロを解決するのは比較的簡単です。
データサイロを壊すということは、必要なタイミングで正しい情報にアクセスできる状態にすることであり、業務意思決定を向上させることに寄与します。データサイロが無くなることで、データの保管コストやデータの重複も削減することができます。
データサイロの原因は?
データサイロが発生する原因は以下のようなものです。
働き方の文化
大企業であるほど、各部門はそれぞれ独立した活動をする傾向があります。部門独自の目標は企業本来の目標と乖離して行き、時に部門間での競合を引き起こすことにつながります。そのため部門の情報は囲い込まれることになり、これがサイロを作ります。
部門ごとにバラバラのシステム
それぞれの部門はそれぞれの専門分野を持っており、個別のシステムを導入しているのが一般的です。たとえば営業部門はSalesforce、マーケティング部門はHootSuite、広報部門はSprout Sociaといった具合です。それぞれのシステムには、もし共有できれば他の部門が大きな利益を得られるデータが数多く含まれています。調査によると、大企業には1200にものぼるシステムがあります。システムが多いほど、情報の共有もまた困難になるはずです。
データサイロの何が問題なのか?
データサイロが問題になるのは、以下のような理由です
データを多面的に見ることができない
データサイロ(データが個々のサイロに閉じ込められている状態)は、企業の360ビュー (あらゆる角度からの多面的な見方)を阻害します。本来は関連するはずのデータの関連性を把握できないためです。例えば、マーケティングキャンペーンのデータです。もし、このデータを営業の売上と組合わせれば、精度の高いキャンペーン効果を知ることができるでしょう。しかしデータサイロは情報共有そのものを阻害してしまいます。
資源のムダ
各部門ごとにデータの形式が異なる顧客データベースを持っていると、それぞれの間でデータの重複が発生します。大量の重複データは、その保管コストを重複して負担することにつながります。データサイロは不要なコスト増を招いている可能性が高いです。
データの不整合
重複したデータは、相互に整合が取れていない場合があります。とくに住所はデータ形式がさまざまであるため、不整合の発生が多くみられます。さらに住所入力には人為的な誤りがつきものであり、不整合の可能性はいっそう大きいといえます。
データサイロによる全社への影響
部門それぞれで独立した活動をしているように見えても、多くの分野で相互に依存しています。例えば、経理部門のデータは、マーケティング部門や営業部門でも分析し、活用できるデータです。企業にとって、競合に対して優位に立つこと、業務の生産性を高めること、コストを削減すること、新たなビジネスチャンスを開拓することは全社的な目標です。そのためには、企業の全情報へのアクセスをよりスムースにすることが欠かせません。データサイロは、このすべてに対する阻害要因です。
データ可視化への障害
データサイロは情報共有を阻害するため、各部門は自分のデータだけを使って分析を行うことになります。データが必要な関係者に行き渡らないことは、こうした全社の非効率性そのものを見えなくしてしまい、コスト削減の機会そのものに気づけなくなってしまいます。
データの信頼性への脅威
データサイロによる部門間のデータ不整合は、やがてデータ全体への信頼性低下へと影響が広がっていきます。特に顕著なのが医療分野で、患者情報が医師のカルテ、看護プロセス、処方、院内運営などさまざまなデータサイロに分断されています。情報がデータサイロに留まっていることで、情報同士の同期がとれず不整合を起こす危険があります。
資源のムダ
重複したデータであっても、データベースへの負荷は変わりません。重複したデータは、そのぶんだけ保管のためのストレージ費用の不要な追加負担、つまりムダとなります。
部門間チームワークの阻害
働き方の文化がデータサイロの形成を促進し、データサイロが部門間の協業を妨げ、それがいっそう非協力的な文化を強化します。
データサイロを解消する方法
組織がデータサイロを取り除く最も簡単な方法は、データウェアハウスにデータを統合することです。
手組みによるデータ統合
一部の企業では、SQLやPythonで書かれたスクリプトでデータを抽出し、データウェアハウスに移動します。この方法の欠点は、時間と工数、それに専門家が必要なことです。
オンプレミスのETLツール
ETL(E:Extract 抽出、T:Transform 変換、L:Load ロード)ツールは、データの移動プロセス全体を自動化し、省力化するのに効果的です。データ移動プロセスとは、データソースからデータを抽出 (Extract)し、必要なマッピングやデータ変換(Transform)を行い、データをデータウェアハウスにロード(Load)します。オンプレミスの場合、ETLツールは社内サーバで運用します。
クラウドETLツール
クラウドで動くETLツールは、ベンダーがインフラとETL機能の両方を提供します。
データサイロの問題意識は、多くの企業がすでに持っています。企業文化を変え、部門の心のサイロを開放するのは困難です。すでにさまざまな権限や階層が強固に固まってしまっています。その第一歩となる候補がデータです。それぞれのデータサイロからデータを収集し、すべてのデータをデータウェアハウスに格納することです。データウェアハウスは容易なデータアクセスやデータ分析のために最適化された仕組みであり、比較的容易に360度ビューを実現することができます。
とはいえ、ツールやテクノロジーの流行を追いかけすぎると、技術的なトレンドに惑わされてしまう可能性もあります。技術よりもビジネス機会やビジネスニーズを分析することから始め、必要なデータソリューションを選択することが望ましいといえます。まずは各部門のもつデータを洗い出し、情報の活用法の調査に投資することが最善です。
目的から始めることで、データの統合に向けてスムースに前進することができます。これが「エンタープライズデータのための統合プラットフォーム」を構築するためのベストプラクティスです。
そのために必要なのは、組織横断的なチームの創設です。役員クラスの旗振りと全面的な支援も重要です。業務へのデータ活用や戦略的なデータ利用をステップバイステップで拡張することで、やがて全社の文化にも目に見える変化が自然に発生するはずです。
データサイロを取り除く作業の実態は、見た目ほど簡単ではありません。データ分析においてデータ準備が作業の80%とも90%とも言われるように、データサイロの開放にも泥臭い仕事が欠かせません。しかし企業がデータを統合してデータを活用し、全社データ駆動を実現することで、その苦労は十分に報われるでしょう。