リファレンスデータとは?
マスターデータとの違いや業界例を紹介

リファレンスデータは、全社で共通に使用するコードであり、外部基準に厳密に従います。財務、人事など様々な業務で利用され、データの整合性を保つ役割を果たします。固定的なデータであるため安定性が高く、異なるシステム間の橋渡しとなります。

リファレンスデータとは?

リファレンスデータとは参照データとも呼ばれ、マスターデータの一種です。マスターの分類(class)を表すためのコードとして、全社のさまざまな場所で使われます。リファレンスデータのコードは外部団体の規定や社内のルールに厳密に準拠しており、ローカルな「方言」などは許されません。リファレンスデータにも階層構造があったり、リファレンスデータ同士の対応があったりする事もあります。リファレンスデータは社内で登録する事もあれば、外部から取り込む場合もあります。

MDM Instituteによると、リファレンスデータには主に「マルチドメインリファレンスデータ」と「リアルタイムリファレンスデータ」の2種類があります。マルチドメインリファレンスデータとは、業種に依存せず複数の業務領域(財務、リスク、コンプライアンス、人事など)やタイプにまたがった(ISO国コードなど固定的なデータ)マスターです。リアルタイムリファレンスデータは通常、ファイナンス市場(ブローカー、アセット・マネージャー、証券サービス会社)や防衛関係で使用されます。IoTにおける利用も増えています。

リファレンスデータはパブリックでもプライベートでも成立しますが、いずれにせよデータの意味と値が固定的なため、安定的に使えることが特徴です。リファレンスデータは異なるドメインやシステム間の橋渡しとなり、リファレンスデータのもつマルチドメイン性と階層を使ったビューを作成することができます。例えば、原価や仕訳のコード・部門コード・事業部コード・地域コード・業界コードなどのリファレンスデータは、顧客マスターや製品マスターとさまざまな面で関連します。

リファレンスデータとマスターデータの違い

マスターデータは、顧客や取引といった業務に関連する主要な要素を表します。一方、リファレンスデータは、個別のマスターデータレコードをさまざまな観点で分類するために使われる分類コードです。リファレンスデータの内容は、ビジネスモデルそのものの構造を反映しており、変更の発生頻度はとても低いものですが、マスターデータの新規発生や変更は日常業務の中でたえず発生するものです。リファレンスデータの変更はビジネスモデルの変更とともに発生するものであるため、わずかな変更であっても全社で把握し、全部門へ同期されなければなりません。ここがリファレンスデータ管理のポイントです。一貫したリファレンスデータ管理の実現には、データガバナンスが大きく関わっています。

リファレンスデータの例

以下は、リファレンスデータの例です。

  • 郵便番号
  • トランザクションコード
  • コストセンター
  • 財務階層
  • 国コード ・都道府県 (州)コード
  • 通貨コード
  • 組織階層
  • 言語コード
  • 顧客セグメント
  • タスクや業務プロセスのコード

リファレンスデータの重要性とは

リファレンスデータは共有範囲が広く、さまざまな業務やシステムで共用されています。リファレンスデータの慎重な管理のためには、登録プロセス管理(ガバナンス)、バージョン管理、ローカルに追加されたカスタム階層などに留意する必要があり、それらを総称してReference Data Management(RDM)と呼びます。リファレンスデータの定義は自然言語(業務用語)で行われること、作成や変更のためのビジネスルールが明示されていること、階層構造があっても正しく維持・管理されていること、共有のための仕組があること、モニタリングによってイレギュラーな変更やデータ品質劣化などがあれば、検知できることなどが必要です。

リファレンスデータは思った以上に至る所にあります。企業のシステムデータの相互運用可能性と精度と同期を維持するためには、リファレンスデータの正しい管理が必要です。もし正しく管理されてなければ、リファレンスデータの分断が発生し、システムごとに異なる方法で変更されて互いに齟齬が発生し、レポーティングが信頼できないものになると同時に、システムの維持コストが増大する危険性があります。

リファレンスデータの管理と集配信を行うことのメリット

企業内でのリファレンスデータ分断は、根本的な部分でのデータ品質低下を引き起こし、業務の中断や意思決定の間違いにつながります。逆に、リファレンスデータを適切な方法で一元管理すると、以下のようなメリットがあります。

  • ITコストの削減:信頼できるリファレンスデータを集約することで、複数システムそれぞれでリファレンスデータを保管し、変更管理をする費用や労力を削減することができます。
  • アジャイルな更新:リファレンスデータが一元管理され、信頼できることによって、システム構築やデータ統合などのプロジェクトにおける現状調査やデータ調査のための期間と工数を削減できます。
  • リスク低減:低品質なリファレンスデータはデータ全体の品質低下につながり、不正確なデータによる判断ミスやコンプライアンス違反の危険があります。逆にリファレンスデータを正確で変更管理の行き届いたものにすることは、それらの危険を根本から防ぐ施策となります。
  • BIの改善:BIに関しても、リファレンスデータの改善によって、レポートの精度や信頼性も連動して向上します。レポートが信頼できることは、データドリブンな意思決定への推進力となります。

主な業界とリファレンスデータ

すべての業界、すべての企業が何らかのリファレンスデータを持っています。以下は、主な業界と主なリファレンスデータの例です。

  • 銀行・金融:金融機関や支点のコードが明確であり共有されていることが必須です。 グローバルでは複数種類のコード体系があります。
  • 政府/公共部門:政府や公共機関はそれぞれのコードを持ち、公的記録のトレーサビリティや相互の意思疎通のために使用します。それらの機関も永遠不変ではなく統合・分離・刷新などが発生します。
  • ヘルスケア:検査結果と患者情報との正確な紐づけ情報として、リファレンスデータが重要です。
  • 旅行業:航空会社、ホテル、レンタカー等の旅行関連企業は、相互連携によって優れた顧客体験を維持するため、それぞれのリファレンスデータを維持し互いに共有しています。
  • eコマース:新企業や実店舗からの移行によって、eコマースにおけるリファレンスデータはますます重要となっています。取引コードや顧客分類コードなどのリファレンスデータは、セキュリティと自動化を両立させるため、一貫性と相互運用性がもっとも重要です。

関連製品

  • TIBCO EBX
    マスターデータ管理(MDM)に必要なデータガバナンス、データマネジメント、名寄せなどの機能をオールインワンで実現するモデル駆動型ソリューション
    詳しく見る
Spotfire® 組織全体でのデータ分析・活用をオールインワンで実現するビジュアルアナリティクスツール 無料トライアル実施中
Spotfireの機能・使い方を動画で学べる Spotfire活用セミナー アーカイブ動画配信中 セミナー動画視聴はこちら
あ行
イーティーエル
(ETL)
異常検知
(Anomaly Detection)
か行
回帰分析
(Regression Analysis)
機械学習
(Machine Learning)
根本原因分析
(Root Cause Analysis)
さ行
散布図
(Scatter Chart)
製造アナリティクス
(Manufacturing Analytics)
た行
ダッシュボード
(Dashboard)
データ移行
(Data Migration)
データ仮想化
(Data Virtualization)
データカタログ
(Data Catalog)
データガバナンス
(Data Governance)
データクレンジング
(Data Cleansing)
データサイエンス
(Data Science)
データサイエンティスト
(Data Scientist)
データサイロ
(Data Silo)
データセキュリティ
(Data Security)
データ統合
(Data Integration)
データ品質
(Data Quality)
データファブリック
(Data Fabric)
データフェデレーション
(Data Federation)
データ分析
(Data Analytics)
データマネジメント
(Data Management)
データマネジメントプラットフォーム
(Data Management Platform)
データメッシュ
(Data Mesh)
データモデリング
(Data Modeling)
データリンキング
(Data Linking)
データレイク
(Data Lake)
テキストマイニング
(Text Mining)
デジタルツイン
(Digital Twin)
デブオプス
(DevOps)
は行
バッチ処理
(Batch Processing)
ビジネス用語集
(Business Glossary)
ビジュアルアナリティクス
(Visual Analytics)
分散分析
(Anova)
ま行
マスターデータ
(Master Data)
マスターデータ管理
(Master Data Management)
マルチドメインMDM
(Multi Domain MDM)
メタデータ管理
(Metadata Management)
ら行
リアルタイム分析
(Real-time Analytics)
リファレンスデータ
(Reference Data)
レーダーチャート
(Radar Chart)
レストフルエーピーアイ
(RESTful API)
ロジカルデータウェアハウス
(Logical Data Warehouse)
論理データモデル
(Logical Data Model)