メタデータ管理とは?
必要性、ユースケース、ツールの機能を紹介
メタデータ管理とは、データに関する情報を整理し、その価値を高める活動です。データのファイル名や作成日時だけでなく、意味や使い方、品質など、様々な情報を管理します。これにより、データの検索や利用が容易になり、より正確な判断が可能になります。
メタデータ管理とは?
メタデータ管理とは、データに関する説明や背景などもろもろの情報(メタデータ)を正しく管理する業務を意味します。充実したメタデータは、企業の情報資産の意味をわかりやすく説明し、データが使えるかどうかの判断を容易にし、欲しいデータを発見できることに寄与し、データのもつ価値を引き出す役割があります。メタデータが提供するのは、システムやデータ、業務そのものの理解を促進し、またそれらを管理するために必要な文脈、つまりさまざまな付帯情報を提供するものです。メタデータの管理を通じて、データはより検索や利用が容易になり、業務や情報部門が必要とする背景情報や付帯情報を提供できるようになります。
メタデータは、まずデータそのものの持つ基本情報です。ファイルの種類、作成時刻、ファイルサイズ、作者などです。またメタデータには、データ説明、データ構造、データ管理情報、参照、統計などさまざまな種類があり、データに関する情報をそれぞれ異なる切り口で提供します。メタデータの作成方法には手動と自動があります。手動だと詳細な情報を付与でき、自動だと一般的にはごく基本的な情報しか得られません。また重要な情報資産ほどより多くのメタデータ管理が必要です。重要な情報資産からより多くの価値を引き出すためです。逆に重要度が低い情報資産にはそれほど多くのメタデータは必要ありません。
メタデータ管理が強固であるとは、企業の様々なシステムにあるデータが高品質で正確、整合がとれているということです。全社的なメタデータ管理戦略を持つ企業は、そうでない場合に比べて、正しいデータに基づいた正しい経営意思決定を下せる可能性がより高くなります。メタデータ管理は、データガバナンスの取り組みにおいて特に重要な要素です。
メタデータの文書化と管理を行う理由
多くの企業におけるデータ管理は、在庫過剰で未整理の本であふれた書店に似ています。豊富なデータが至る所にありながら、整理もカタログ化もされていないため、必要な情報を見つけることが困難です。
これはデータの「検索性」と「利用性」が低いことを意味します。そして近年、ビッグデータによってさらに問題は拡大しました。企業データはここ10年でギガバイトからテラバイト、さらにペタバイト級に増大し「データは産業の新しい石油」と呼ばれる時代になりました。企業は生き残りをかけて、利用できるすべてのデータを駆使し、活用することで競争優位を競っています。メタデータの記述を充実させることが、必要なデータを発見し利用するために不可欠です。
メタデータ管理のポイントは、部門や業務など文脈しだいでデータの定義が異なることです。例えば同じ「顧客」という用語であっても、システム部門と営業部門、法務部門など、部門が違えば意味もデータ管理方法も異なるかもしれません。システム部門にとって「顧客」データは、レポートやダッシュボードを作成するための技術情報かもしれません。「顧客」データの場所を尋ねてみれば「自社の顧客データは2015年稼働の全社データウェアハウスにあります。今回買収した会社の顧客データはデータレイクにありますが、レポーティングをする前に変換する必要があります」と答えるかもしれません。彼らにとって、「顧客」データは非常に分析に特化したものであったり、推移を見るための素材です。
営業部門では、日々の営業活動における顧客データ利用だと考えるでしょう。現在アクティブな顧客企業だけに関心があり、過去の取引先には無関心かもしれません。また顧客データは会社名のみを意味し、個人情報は顧客として扱っていないかもしれません。しかし法務部門では、GDPRなどの個人情報管理に注力し、個人としての顧客データに重点を置いているかもしれません。
メタデータの問題は、単にデータ定義を明記するだけでは解決しません。異なる部門・異なる業務において異なる複数の定義が存在するからです。加えてデータはますます増え続けています。
データ分析を行うためには、まずデータを見つける必要があります。日常業務では、それぞれのシステムやデータベースごとのデータの有り場所を把握しておきたいと思うでしょう。法務部門では規則の遵守状況を確認したいと思うでしょう。システムIT部門は、分析や過去の推移を記録し保持することに関心があるはずです。
メタデータ管理の推進は、企業の各部門において必要なメタデータ (システム情報、データ基本情報など)を提供し、企業活動を理解し管理するために必要です。メタデータ管理は、企業の機能が適切に発揮され、正しい意思決定が行われていることを確実にする最善の方法です。
メタデータ管理のユースケース
メタデータ管理は、社内の各部門それぞれが同じデータの見方をしながら、同時に自部門固有の問題を解決できる状態を実現します。
- 分析:よりインサイトを得られる分析をするために、アナリストはセルフサービスでデータカタログを検索し、独自のメタデータを自部門のワークフローで登録することで、分析に必要なデータを検索し、理解し、準備します。メタデータは「今回の分析に最適な売上データはどれか?」という質問に答えます。
- 業務:生産性向上にむけ、業務部門では全社のメタデータ資産やデータ連携を調査、発見および管理します。メタデータは「納期回答をするためのデータはどのシステムが持っているか?」という質問に答えます。
- 法務:個人情報規制(GDPR、CCPA、BCBS 239など)対応のためのデータプライバシー・コンプライアンス活動を行います。データガバナンスチームは個人情報や秘密情報などを特定し、定義を文書化し、コンプライアンス状況を報告します。メタデータは「どのデータが個人情報で、どこでどのように管理しているか?」という質問に答えます。
メタデータ管理ソリューションの機能
メタデータ管理ソフトウェアは、すべてのメタデータを一元管理するツールです。以下のような機能があります。
- メタデータ管理:ビジネス定義、用語集、ルールなどのさまざまなメタデータ要素を全社から収集し一箇所に集約、一元管理します。
- データガバナンス:データガバナンス方針の記述や、規制に対するコンプライアンス対応などを文書化し記録・参照します。
- データカタログ:さまざまな基盤システムの持つ重要なデータ資産に関するすべての物理情報を網羅してカタログ化し、検索や運用、アクセス権限管理などを行います。
メタデータ管理機能の全体像とは、
- メタデータの発見と自動取得:オンプレミスまたはクラウドのシステムからメタデータやメタデータの変更を自動的に収集します
- メタデータストア:すべての業務メタデータやシステムメタデータを一か所で管理する、メタデータのデータベースです
- 分類とリネージュ:メタデータ資産の適切な分類を行う「分類」、データの生成や移動といった系譜(リネージュ)のビジュアル画面
- ガバナンスとセキュリティ:システムメタデータだけでなく、ビジネス用語集、データガバナンスポリシー、コンプライアンス文書など必要な情報をすべて一元的に管理します
- 検索と評価:ユーザーはデータカタログ全体から必要なデータを検索できます。またコメントや星印などでデータを評価し、フィードバックを与えることができます。
- データ品質KPI:メタデータ品質に関するKPIを記録し、トレースします
- 情報共有とデータアクセス:メタデータ情報をサービスとして公開します。またカタログから対象へのデータアクセスを支援します
メタデータ管理による全社横串連携のために
社内データリテラシー向上のためには、部門横断での協力体制が必須です。とくに、データ管理者とデータ利用者とのコミュニケーションを実現できることがメタデータ管理ソリューションには必要です。
メタデータ管理によるコラボレーションの例を見てみましょう。例えば、データガバナンス部門は個人情報の見極めや規制遵守に関心がありますが、システム部門と協力する必要があります。システム部門は、物理データベースのカタログ化やシステム制約・ルールの文書化、プライバシー教育実績などの管理のためにデータガバナンス部門と協力する必要があります。さらに、アナリストは大量のデータを消費しているため、社内のガバナンスポリシーに従っていることを確認したいと思っています。それぞれのチームは様々なタイミングで協力する必要があります。
メタデータ管理ソリューションに必要な機能は、ワークフロー、メタデータ管理、履歴管理、監査証跡などコラボレーションを通じたガバナンスのための機能です。 現状の問題は、メタデータの多くが複数のシステムに分散しており、メタデータのサイロが生じていることです。例えば、一部のメタデータはETLで管理しているいっぽう、データガバナンスには専用のワークフローを使っていたりします。さらにはデータカタログのために専用のシステムを持っており、それぞれが別々にメタデータを保管しています。本来、すべての情報はつながっています。データをより良く統合し、一貫性をもたせ、全体をよりコントロールするためにはすべてが一か所にあることが最善です。必要な機能をすべて備えたメタデータ管理ソリューションはそのためのものです。
メタデータ管理とAI
エッジデバイス、IoT、AIの台頭はメタデータ管理にも影響を及ぼしています。さらなるデータから、さらなる価値を引き出すことが可能になり、また求められるようになったためです。業務および生産性におけるメタデータの価値は、それら大量の種類のデータをカタログ化、マッピング、データモデリング、機械学習することでいかに活用するかにかかっています。メタデータ管理は今後、AI機械学習を活用することでメタデータの分類や関係付けが促進され、いっそう業務の生産性と意思決定に寄与していきます。
関連製品
-
TIBCO EBXマスターデータ管理(MDM)に必要なデータガバナンス、データマネジメント、名寄せなどの機能をオールインワンで実現するモデル駆動型ソリューション詳しく見る