データマネジメントとは?
重要性とユースケースを紹介
データマネジメントとは、企業が持つ様々なデータを一元化し、安全に管理することで、データの品質を高め、誰でも簡単に使えるようにする活動です。MDM(マスターデータマネジメント)などのツールを使い、データのアクセス性、信頼性、そして管理の効率化を図ります。
データマネジメントとは?
データマネジメントとは、データ要件に応じた一貫性のあるアクセシビリティ、配信、ガバナンス、セキュリティを確保する活動のことです。MDM(マスターデータマネジメント)、データ仮想化、データカタログ、セルフサービス型のデータプリパレーションやラングリングなどのツールが使われます。
企業がすべてのデータを有機的に統合し、より良い「アクセス (データの参照と取得)」「トラスト (データの品質と信頼性)」「コントロール (制御とガバナンス)」を実現できるようにするのが、優秀なデータマネジメントソリューションです。
データマネジメントが企業にとって重要なのは、顧客体験(カスタマーエクスペリエンス)の向上、業務の最適化(オペレーショナルエクセレンス)、組織変革(イノベーション)にかかわるあらゆる取り組みが、今やデータ活用に大きく依存しているためです。データマネジメントを実現するためには、組織は自身のメタデータ、リファレンスデータ、トランザクションデータ、マスターデータ、ストリーミングデータなど、すべてのデータについて理解し、明示的に整理する必要があります。全社にわたって分散したデータを適切な方法で統合し、一元化できて初めて、全社のどの部門もより迅速かつ正確な意思決定を行うことができます。
別の言い方をすると、データマネジメントとは、データのサイロを解消し、マスターデータやリファレンスデータを一元化し、すべてのデータに対するアクセス・検索・活用を容易にするソリューションのことです。一元化されたデータソースは、さまざまな部門やユーザー、さまざまな業務の局面において、すべてのデータ資産を活用することを可能にします。これにより、現代の複雑化した課題に直面した時でも、データドリブンな意思決定をすることができるようになります。
なぜデータマネジメントがビジネスのカギになるのか?
今日、ほとんどの企業でデータ戦略を策定していますが、まだ真のデータドリブンと呼べるには至っていません。データをビジネスで競争優位に立つためのビジネス資産として扱っていないのです。逆にこうした現状において全社的なデータ基盤の構築に着目することは、大きなチャンスといえます。データマネジメントにおいて主流であるマスターデータマネジメント(MDM)、メタデータマネジメント等のツールは、データセントリックなビジネスを実現し、より高い経営目標の達成に寄与することができます。
成功するデータマネジメントの特徴は?
効率的なデータマネジメントにはデータ基盤の構築が必要であり、その実現には整合性がとれていて、かつ多面的なアプローチが必要だと言われます。では、具体的にどのようなデータ基盤を目指すべきなのでしょうか。 以下はその代表的な特徴です。
- データガバナンスの確立: 承認されたユーザーのみが、データへアクセス可能とするセキュリティを確保し、同時に承認されたユーザーに理解しやすいメタデータを提供することで、欲しいデータを簡単に検索できる。
- データの種類: 構造化データだけでなく、非構造化データ、ストリーミングデータなど、さまざまな種類のデータに容易にアクセスできる。
- 変化対応力 : ビジネスニーズの変化に合わせて進化が容易である
- レガシー連携 : 優れたデータ連携によって、新システム導入の際に現行システムを完全に置き換える必要がない。
- データ整合 : 部門間でデータの整合がとれており、互いのデータ共有が容易である。さまざまな分析・ガバナンス用途にも応用できる。
データ品質は主に以下の6つ指標で測定します。
- 適合性:データの範囲、フォーマット、型などの違反。少ないほどよい。
- 整合性:異なるオブジェクトやイベント間のデータ齟齬。少ないほどよい。
- 一意性:複製されたコピーの数。 少ないほどよい。
- 正確性:データが「現実」のものごとを反映している。 間違いが少ないほどよい。
- 完全性:関連するすべてのデータが含まれている。 空欄、抜け漏れが少ないほどよい。
- 適時性:データが必要な鮮度で得られている。遅れていなければよい。
データマネジメントの主な機能
データ品質: 対応する現実世界の要素を正しく表し、かつ目的の用途に適合している高品質なデータを提供する。
データ仮想化: データを仮想化することで統合し、データのサイロ化を解消する。オンプレミスからでもクラウドからでも、必要なすべてのデータにアクセスし、データを理解し、データを利用できるような仮想的なデータの場所を作る。
データガバナンス: データガバナンス活動の全般を支えることで、法規制や内部統制に沿ったデータの提供と使用を可能にする。
MDM(マスターデータマネジメント): MDMは、顧客、資産、所在地、サプライヤー、製品、会計、リファレンスデータなど、企業のビジネスのあらゆる面を表すデータを単一の場所に集約する。MDMは業務、アナリティクス、データガバナンスのすべてに影響するデータの正確性と整合性を保つために不可欠である。
メタデータマネジメント: 用語辞書、データ辞書、システム辞書などを構築、運用、活用する機能。また、それを維持するためのルールやポリシーおよびデータアクセス権を管理し、ユーザーのデータ検索やデータ流通を促進する。
データカタログ: 業務ユーザー、データサイエンティスト、アナリストが、権限のあるすべてのデータ資産に容易にアクセスできるようにして、データ活用を支援するための機能。分析に必要なデータを簡単に見つけられると同時に、企業にとってのデータガバナンスを確保する。
データマネジメントの主なユースケース
Data as a Service(DaaS)
Data as a Service(DaaS)は、社内外からのニーズに応じて、データをサービスとして公開することです。
仮想データレイヤー
仮想データレイヤー(データ層)を設置し、実データが仮想データレイヤーを通過することで、企業は必要なすべてのデータに対して参照、統合、活用することができるようになります。セキュリティを確保しつつ、データサイロを越えた自在なデータ流通を可能にする仕組みです。
論理データウェアハウス
仮想データレイヤーを利用したアーキテクチャの一つです。データや分析のニーズが絶えず変化する中、そうした変化に素早く対応し進化できるのが特長です。通常のデータウェアハウスは最初にゴールを設定し、合目的的な開発を行いますが、論理データウェアハウスは動くゴールに合わせて自在に変化でき、それでいて新たなデータサイロを作りません。
マルチドメインMDM
ドメインとは「製品マスター」「顧客マスター」など個々のマスターの種類のことです。マルチドメインMDMはいかなるマスターも扱うことができ、社内の全マスターを網羅することができます。さまざまなマスターが整合性と正確性を獲得することで、業務の生産性向上や、分析とレポーティングの品質向上が期待できます。
Anything 360
システムを越えてデータを統合し、あらゆる角度からデータを分析できることを「360度」ビューと呼び、卓越した顧客体験の提供、サプライチェーン最適化、新製品リリースのスピードアップを強力に支援します。また360度ビューはマスターデータ、リファレンスデータ、ストリーミングデータ、トランザクションデータなどさまざまなデータ同士の整合性をも意味します。「360度」であることは、デジタルビジネスの成功にとって非常に重要です。
リファレンスデータマネジメント
リファレンスデータとは、マスターデータの一種であり、たとえば、郵便番号・コストセンター・勘定科目などを指します。リファレンスデータマネジメントの本質は分類と階層構造であり、リファレンスデータをシステム間、部門間で共有できることがその価値です。
データファブリックとデータマネジメントの関係
データファブリックとは、近年誕生した分散アーキテクチャの一種で、「データ資産の共有」と「最適化されたデータパイプライン」の2つでできています。データファブリックは、以下のような今日のさまざまなデータ課題に対して個別対応するのではなく、一つの統一的な方式で対処します。
- あらゆるユーザーのあらゆるデータ要件:データ分析、業務運用、実績、データガバナンスなどさまざまな用途に対応し、ビジネスユーザーのセルフサービスを実現し、また提供されるデータの信頼性を担保する。
- あらゆるソースからのあらゆるデータ:分散したデータソースに保管されている動的ストリーミングデータや静的データベースにアクセスし、メタデータ管理、データ加工設定、データ公開などの機能を駆使することで、それらすべてのデータを取得、変換、統合する。
- あらゆる環境:オンプレミス、クラウド、ハイブリッド、マルチクラウドに分散したデータ環境に柔軟に対応できる。
ある種のツールベンダーの主張とは逆に、データファブリックは何か一つの製品を買ってきて既存の環境のどこかにインストールできる類のものではありません。分散アーキテクチャや共有データ資産、データマネジメント、メタデータマネジメント、データ集配信統合などの技術を総合し、最適化されたデータパイプラインがデータファブリックです。
今日のデータはかつてないほどに分散しています。それを前提として、モダンなデータマネジメントとデータ統合を実現することで、以下のようなことが達成できます。
- より多くのデータ要求に対応:分析、オペレーション、実績データ、データガバナンス、セルフサービスなど各種のアクセスに対応できる仮想データ環境を提供する。
- より多くのデータ種類に対応:オンプレミス、クラウド、IoT、他社SaaSに対応し、また静的データ(データベース)と動的データ(ストリーミングデータ)の両方に対応できる。
- データ流通の最適化:データファブリックは、データおよびメタデータマネジメントの両面でインテリジェントにデータを統合し、配信を管理できる。
- より柔軟でスケーラブル:データファブリックは、ますますオンプレミス、マルチクラウド、ハイブリッドといった各種の環境に柔軟に対応し、スモールスタートも横展開も容易である。