データサイロとは?
サイロ化の原因と問題点、3つの解消方法

データサイロは、データが組織内で孤立し、共有されない状態です。これにより、業務効率が低下し、コストが増加します。データサイロを解消することで、必要な情報に迅速にアクセスでき、より良い意思決定が可能になります。また、データの重複や保管コストを削減することもできます。

データサイロとは?

データサイロとは、データが組織から離れた独自の”かたまり”を形成し、その情報を必要とする部門に行き渡らない現象のことです。データサイロはビジネスにとってコストと時間のロスをもたらしますが、データサイロを解決するのは比較的簡単です。

データサイロを壊すということは、必要なタイミングで正しい情報にアクセスできる状態にすることであり、業務意思決定を向上させることに寄与します。データサイロが無くなることで、データの保管コストやデータの重複も削減することができます。

データサイロの原因は?

データサイロが発生する原因は以下のようなものです。

働き方の文化

大企業であるほど、各部門はそれぞれ独立した活動をする傾向があります。部門独自の目標は企業本来の目標と乖離して行き、時に部門間での競合を引き起こすことにつながります。そのため部門の情報は囲い込まれることになり、これがサイロを作ります。

部門ごとにバラバラのシステム

それぞれの部門はそれぞれの専門分野を持っており、個別のシステムを導入しているのが一般的です。たとえば営業部門はSalesforce、マーケティング部門はHootSuite、広報部門はSprout Sociaといった具合です。それぞれのシステムには、もし共有できれば他の部門が大きな利益を得られるデータが数多く含まれています。調査によると、大企業には1200にものぼるシステムがあります。システムが多いほど、情報の共有もまた困難になるはずです。

データサイロの何が問題なのか?

データサイロが問題になるのは、以下のような理由です

データを多面的に見ることができない

データサイロ(データが個々のサイロに閉じ込められている状態)は、企業の360ビュー (あらゆる角度からの多面的な見方)を阻害します。本来は関連するはずのデータの関連性を把握できないためです。例えば、マーケティングキャンペーンのデータです。もし、このデータを営業の売上と組合わせれば、精度の高いキャンペーン効果を知ることができるでしょう。しかしデータサイロは情報共有そのものを阻害してしまいます。

資源のムダ

各部門ごとにデータの形式が異なる顧客データベースを持っていると、それぞれの間でデータの重複が発生します。大量の重複データは、その保管コストを重複して負担することにつながります。データサイロは不要なコスト増を招いている可能性が高いです。

データの不整合

重複したデータは、相互に整合が取れていない場合があります。とくに住所はデータ形式がさまざまであるため、不整合の発生が多くみられます。さらに住所入力には人為的な誤りがつきものであり、不整合の可能性はいっそう大きいといえます。

データサイロによる全社への影響

部門それぞれで独立した活動をしているように見えても、多くの分野で相互に依存しています。例えば、経理部門のデータは、マーケティング部門や営業部門でも分析し、活用できるデータです。企業にとって、競合に対して優位に立つこと、業務の生産性を高めること、コストを削減すること、新たなビジネスチャンスを開拓することは全社的な目標です。そのためには、企業の全情報へのアクセスをよりスムースにすることが欠かせません。データサイロは、このすべてに対する阻害要因です。

データ可視化への障害

データサイロは情報共有を阻害するため、各部門は自分のデータだけを使って分析を行うことになります。データが必要な関係者に行き渡らないことは、こうした全社の非効率性そのものを見えなくしてしまい、コスト削減の機会そのものに気づけなくなってしまいます。

データの信頼性への脅威

データサイロによる部門間のデータ不整合は、やがてデータ全体への信頼性低下へと影響が広がっていきます。特に顕著なのが医療分野で、患者情報が医師のカルテ、看護プロセス、処方、院内運営などさまざまなデータサイロに分断されています。情報がデータサイロに留まっていることで、情報同士の同期がとれず不整合を起こす危険があります。

資源のムダ

重複したデータであっても、データベースへの負荷は変わりません。重複したデータは、そのぶんだけ保管のためのストレージ費用の不要な追加負担、つまりムダとなります。

部門間チームワークの阻害

働き方の文化がデータサイロの形成を促進し、データサイロが部門間の協業を妨げ、それがいっそう非協力的な文化を強化します。

データサイロを解消する方法

組織がデータサイロを取り除く最も簡単な方法は、データウェアハウスにデータを統合することです。

手組みによるデータ統合

一部の企業では、SQLやPythonで書かれたスクリプトでデータを抽出し、データウェアハウスに移動します。この方法の欠点は、時間と工数、それに専門家が必要なことです。

オンプレミスのETLツール

ETL(E:Extract 抽出、T:Transform 変換、L:Load ロード)ツールは、データの移動プロセス全体を自動化し、省力化するのに効果的です。データ移動プロセスとは、データソースからデータを抽出 (Extract)し、必要なマッピングやデータ変換(Transform)を行い、データをデータウェアハウスにロード(Load)します。オンプレミスの場合、ETLツールは社内サーバで運用します。

クラウドETLツール

クラウドで動くETLツールは、ベンダーがインフラとETL機能の両方を提供します。

データサイロの問題意識は、多くの企業がすでに持っています。企業文化を変え、部門の心のサイロを開放するのは困難です。すでにさまざまな権限や階層が強固に固まってしまっています。その第一歩となる候補がデータです。それぞれのデータサイロからデータを収集し、すべてのデータをデータウェアハウスに格納することです。データウェアハウスは容易なデータアクセスやデータ分析のために最適化された仕組みであり、比較的容易に360度ビューを実現することができます。

とはいえ、ツールやテクノロジーの流行を追いかけすぎると、技術的なトレンドに惑わされてしまう可能性もあります。技術よりもビジネス機会やビジネスニーズを分析することから始め、必要なデータソリューションを選択することが望ましいといえます。まずは各部門のもつデータを洗い出し、情報の活用法の調査に投資することが最善です。

目的から始めることで、データの統合に向けてスムースに前進することができます。これが「エンタープライズデータのための統合プラットフォーム」を構築するためのベストプラクティスです。

そのために必要なのは、組織横断的なチームの創設です。役員クラスの旗振りと全面的な支援も重要です。業務へのデータ活用や戦略的なデータ利用をステップバイステップで拡張することで、やがて全社の文化にも目に見える変化が自然に発生するはずです。

データサイロを取り除く作業の実態は、見た目ほど簡単ではありません。データ分析においてデータ準備が作業の80%とも90%とも言われるように、データサイロの開放にも泥臭い仕事が欠かせません。しかし企業がデータを統合してデータを活用し、全社データ駆動を実現することで、その苦労は十分に報われるでしょう。

関連製品

  • TIBCO EBX
    マスターデータ管理(MDM)に必要なデータガバナンス、データマネジメント、名寄せなどの機能をオールインワンで実現するモデル駆動型ソリューション
    詳しく見る
  • TIBCO
    Data Virtualization
    日々変化するビジネス要求に応じるため、散在するあらゆるデータを複製することなく仮想的に統合し、ビジネスで活用できるデータに変換して提供するデータ統合ソリューション
    詳しく見る
Spotfire® 組織全体でのデータ分析・活用をオールインワンで実現するビジュアルアナリティクスツール 無料トライアル実施中
Spotfireの機能・使い方を動画で学べる Spotfire活用セミナー アーカイブ動画配信中 セミナー動画視聴はこちら
あ行
イーティーエル
(ETL)
異常検知
(Anomaly Detection)
か行
回帰分析
(Regression Analysis)
機械学習
(Machine Learning)
根本原因分析
(Root Cause Analysis)
さ行
散布図
(Scatter Chart)
製造アナリティクス
(Manufacturing Analytics)
た行
ダッシュボード
(Dashboard)
データ移行
(Data Migration)
データ仮想化
(Data Virtualization)
データカタログ
(Data Catalog)
データガバナンス
(Data Governance)
データクレンジング
(Data Cleansing)
データサイエンス
(Data Science)
データサイエンティスト
(Data Scientist)
データサイロ
(Data Silo)
データセキュリティ
(Data Security)
データ統合
(Data Integration)
データ品質
(Data Quality)
データファブリック
(Data Fabric)
データフェデレーション
(Data Federation)
データ分析
(Data Analytics)
データマネジメント
(Data Management)
データマネジメントプラットフォーム
(Data Management Platform)
データメッシュ
(Data Mesh)
データモデリング
(Data Modeling)
データリンキング
(Data Linking)
データレイク
(Data Lake)
テキストマイニング
(Text Mining)
デジタルツイン
(Digital Twin)
デブオプス
(DevOps)
は行
バッチ処理
(Batch Processing)
ビジネス用語集
(Business Glossary)
ビジュアルアナリティクス
(Visual Analytics)
分散分析
(Anova)
ま行
マスターデータ
(Master Data)
マスターデータ管理
(Master Data Management)
マルチドメインMDM
(Multi Domain MDM)
メタデータ管理
(Metadata Management)
ら行
リアルタイム分析
(Real-time Analytics)
リファレンスデータ
(Reference Data)
レーダーチャート
(Radar Chart)
レストフルエーピーアイ
(RESTful API)
ロジカルデータウェアハウス
(Logical Data Warehouse)
論理データモデル
(Logical Data Model)