2021/11/09
数年前に"SoR""SoE"という言葉が流行しました。これらは、それぞれ"Systems of Record"、"Systems of Engagement"の略称です。従来型の基幹システムを脱して、顧客に「エンゲージ」するためのSoEを作りましょうという主張でした。
しかし、結果的にこれらの主張はあまり流行りませんでした。そもそも「エンゲージ」とは何か? がピンと来なかったためです。身近でエンゲージというとエンゲージリングかTNGのピカード艦長くらいしか思い浮かびません。
数年たった今、データ仮想化に接することでSoRとSoEについて改めて整理することができました。
SoRとは、つまりデータを食わせるためのシステムです。
データは基本的に人が登録、入力を行います。自分の行ったこと/決めたこと/これから行うことを登録していきます。そのデータは、次の人に向けた「指示」となって出てきます。例えば、注文を登録すると出荷指示が出てきます。出荷を登録すると請求指示が出てきます。このようにSoRとは登録と指示によって人と人を繋ぎ、業務から業務へとデータが流れるシステムです。要件定義で業務フローやデータフローも描くのも、これが理由です。
SoRでデータを扱うにには、まず登録が必要です。他のシステムからデータを貰うときも同様です。システム間のデータ連携とは、データを渡す/受け取る/登録するまでのワンセットです。
つまりSoRとは、原理的にデータ連携をするほどデータのコピーができるシステムです。
この用途に最適なのがETL(Extract=抽出/Transform=変換/Load=登録)です。業務から業務へとデータの受け渡すイメージそのままにデータを渡すシステムです。
SoRがデータを食わせるシステムであるのに対し、SoEはデータを吐き出すシステムです。
吐き出すとは言っても、吐き出すのはコアダンプでも何でも良いわけではありません。より具体的に言うと、「役に立つ色々な情報を、見やすく、タイムリーに提供する」のがSoEです。身近な例だとおすすめの商品だったり、今週末のセール案内などが該当します。
SoEでは、データはあちこちから同時にやってきて、目の前に見せてくれます。SoRと違い、流れがあるわけではありません。どこからデータを貰うかも問題ではありません。見せたいデータを、持っているところから取ってくるだけです。
SoEでは、データは見たらおしまいです。次に見たくなれば、また取ってくるまでのことです。その意味でも、データは一旦コピーを取ってくるSoRとは異なります。
昨今、至るところでデータ活用の重要性が説かれています。そしてデータサイエンス、機械学習、ビジネスインテリジェンスなど、さまざまなテクノロジーが世の中に出てきています。これらのテクノロジーも方法こそ違えど、いずれも「役に立つ色々な情報を、見やすく、タイムリーに提供する」のが目的です。つまりSoEと同じなのです。
ならば、データの流れにこだわらず、コピーを作らず、今欲しいデータをどこからでもすぐに手に入れられれば便利です。
ETLも進化していますが最適解とは言えません。その理由は、ETLはデータのコピーを作るからです。まず、データのコピーはストレージを食います。さらにRDBであればスキーマ設計から必要ですし、大抵の場合バックアップも用意します。設計変更も負担がかかり、例えば10個のコピーがあれば、項目を一つ増やすだけで10カ所で設計変更が生じていまいます。
データ仮想化とは、データを直接見に行く技術です。行き先がRDBでもXMLでもCSVその他いくつあっても、通常のSQLでビューを作ることができてしまう仕掛けです。
ビューに実体がないように、データ仮想化にも実態はありません。しかし、ビューに問い合わせれば答えがでるように、データ仮想化も問い合わせれば答えが出ます。
データ仮想化はデータそのものではなく、データを見せる仕組みです。そして見せる際には、個人情報のマスキングや秘密情報のガードも可能です。
定型のレポートをときどき眺めているだけなら、SoRの発想でも困りません。しかし、もし今後色々とデータが増え、それらのデータを見ながらビジネスを進めるのであれば、SoEがヒントになるかも知れません。