DXを推進しようとすると、ほぼ間違いなく「新たなデータ活用」というテーマが出てきます。その理想形は「データファブリック」と呼ばれます。データの連携が網(ネットワーク)より密で、布(ファブリック) のように隅々まで届いている状態がデータファブリックです。どんなデータもエンドユーザーが欲しい時にセルフサービスで使えます。それが「データの民主化(democratization)」です。
特に機械学習において、毎回ことなるデータが必要です。 「データの民主化 」は喫緊の課題となっています。
データの民主化には大きな壁があります。“どんなデータがどこにあるか分からない”ということです。
ビッグデータと言われて10年以上、データは量も種類も増大し、有り場所も分散しています。まずは「データを全部まとめた一覧表」つまりデータカタログが必要です。しかし単にデータをカタログ化しただけでは実用になりません。むしろ入り口、一歩踏み出した状態です。データの名前だけの一覧表を眺めても「どんなデータ」だか分かりません。欲しいデータは結局みつかりません。
それを補うのがメタデータです。メタデータとは、あるデータを説明してくれるいろいろな情報すべての事です。データの「型」や「意味」はメタデータです。「誰が作ったか」「どこから引用したか」もメタデータです。データカタログが役に立つのはメタデータ次第であり、そのための活動がメタデータ管理です。
本セミナーでは、データマネジメントの中核でありながら、範囲が広く正体のつかみにくい「MDM(マスターデータ管理)」について、全7回にわたりその手法を個別に徹底解説します。第4回目のテーマは「メタデータ」です。
顧客に関する情報が顧客マスターで、製品に関する情報は製品マスターです。メタデータはデータに関する情報なのだから、データマスターとも呼べる存在です。今回のセミナーでは「メタデータ管理」について、そもそもメタデータとは何なのかという基本的な内容から、MDMと同じ図式で実践的な進め方のポイントを解説します。
NTTコム オンライン・マーケティング・ソリューション株式会社
TIBCO部
エバンジェリスト
水谷 哲
大手メーカー、外資系企業にて生産管理に従事。需要予測・需給計画・スケジューリング・MES全般に携わる中、データモデリングをきっかけにマスターデータ管理(MDM)と出会い、複数のMDMプロジェクトの推進に取り組む。
現在は、NTTコム オンラインにてTIBCOのエバンジェリスト活動に従事しながら、日本データマネジメント・コンソーシアム(JDMC)の研究員やMDM研究会リーダを務め、各種セミナー等で講演。