バブルチャートとは?
3要素の分析例と注意点

バブルチャートは、「製品の販売数、価格、市場シェア」や「各国の人口、GDP、平均寿命」など、3つの要素の関係性を、バブルの大きさ、位置、色によって視覚的に表現し、データの大小や関連性を直感的に理解できるグラフです。
この記事では、バブルチャートの基本概念から読み方、活用事例、作成時の注意点まで、図解を交えながらわかりやすく解説します。

探索的分析/原因分析の領域で
高い評価と実績
TIBCO Spotfire

Spotfireは分析に必要な機能を単一製品でカバーするビジュアルアナリティクスツールです。

バブルチャートとは?

バブルチャートは、分析者により豊富なデータに潜む情報を与えるために三つ目の次元が必要な場合に使用されます。バブルプロットは、3つの変数を比較するためのグラフです。 他の3次元グラフが通常x、y、zの3つの軸を使ってデータを表現するのに対し、バブルチャートは2つの軸(xとy)で表され、バブルの大きさが第3の重要な情報を伝えます。

データを表現するために使われる各種のグラフの中でも、バブルチャートは面白い外観をしています。相互関係の表現に加えて、バブルチャートは通常、最初の2つの次元から独立した重要な第3の次元を視覚化します。 標準的な折れ線グラフは、特定の種類の商品(例えば、電子製品の販売価格)に費やされた金額を示すかもしれませんが、バブルチャートには情報が追加されます。以下の例では、電子製品の販売価格と家具の販売価格が表示され、円は購入された数量を表します。

バブルチャートは、データの関係を観察するためには良いですが、データを正確に表現するためには適していません。成長率を表すバブルの大きさだけでは、成長率に関する正確な数値を提供できませんが、読者に概要を示し、成長率を他の2つの数量と比較できます。

なぜバブルチャートを使うのか?

バブルチャートは、3つの変数に関係があるかどうかというような、二択の質問に答えるために役立ちます。この関係でパターンを強調できます。

例えば、ある国の人口はもともと多くても少なくてもよいですが、保健衛生施設が利用できるようになると急速に成長します。逆に、人口抑制策が実施されると急速に減少します。このシナリオでは、インフラが改善されるにつれて、バブルの大きさが時間経過とともに増加することが観察できます。この社会経済的な例では、バブルチャートは異なる変数が時間の経過とともに、どのように移動するかを理解するのに役立ちます。

バブルチャートはビジネスでも有用です。実際、バブルチャートは現在の中核的な金融プロセスの1つである、評価と投資でよく使用されます。例えば、評価コストを1軸で表し、価値を表すためにもう1軸を使用し、バブルの大きさがリスクを表すことで、リスクと比較した評価コストを観察することができます。 電子製品販売および家具販売に関する上記グラフを見ると、パターンが見てとれます。バブルチャートの難しい側面は、パターンを解釈することです。

バブルチャートの読み方と理解の仕方

バブルチャートは、他の2次元チャートと同様に、はじめにX軸とY軸をプロットします。通常これらの変数は、もともと存在する関係、または変数間に実際に関係が存在するかどうかを観察するために選択されます。例えば、家具と電子製品の販売の関係です。

 バブルの大きさは、パラメーターの重みを表すために使用されます。人口の例では、これは、各国の人口です。ビジネスでは、観客数、時間に伴う潜在的な価値の成長、店舗の大きさ、またはその他の要素の大きさを表すパラメーターのいずれかが使用されることがあります。

層別する必要があるビッグデータを表すために、異なる色のバブルを使って差を表現することがあります。例えば、アメリカの店舗で購入されたアイテムは赤で表示し、オセアニアの店舗は青で表示することができます。レベルの粒度は、目的によって異なります。現在では、これらのチャートをアニメーションで表現し、時間的な動きを示すことができるツールがあります。

各バブルチャートには、対象のデータセットに適した機能があります。バブルチャートは以下のような要素を強調するために使用されます。

  • 外れ値:バブルチャート上で他と異質な点。こうした外れ値は重要な情報になります。
  • ギャップ:他のチャートと同様に、バブルチャート上でギャップがある場合は、データの欠落を確認するためにさらなる調査が必要です。
  • クラスタ:バブルチャート上でクラスタは外れ値と逆です。クラスタは重なり合った空間にあるバブルのグループです。例えば、別々の地理的地域がまとまって見える場合は、その理由を確認する価値があります。

これらのパターンを特定して深く調査する前に、データが本当に正しいか確認し、同一の方法で収集されたデータに基づいて比較されていることを確認してください。

バブルチャートを使用する際のベストプラクティスとよくある落とし穴

バブルチャートを使用する場合、正確に表されるのは2つの次元のみであることを覚えておいてください。他の2つのパラメーターが表されているため、混乱しないようにベストプラクティスに従うことが重要です。

また、点の数が多いほど、より多くの情報を提供する散布図とは異なり、バブルチャートはあまりにも多数のデータを表すと、混乱する可能性があります。バブルが重なったり、塊になったりすると、見る人は誤った結論を引き出すことがあります。したがって、バブルチャートでは、バブルは少ない方が良いです。

通常、バブルチャートは負の値を表すのに向いていません。これは、円は負の値を表現することができないためです。ただし、必要に応じて負の値を表すために空の円を使用し、正の値に対しては色が塗られた円を使用できます。これは稀なケースであり、ほとんどのバブルチャートでは、国の人口など正の値を表すためにバブルを使用します。

バブルチャートは、その特性や限界をしっかりと把握していれば、データを直感的に伝えられる便利な可視化ツールです。これらのチャートは視覚的に素晴らしい印象を与えますが、常に最適な情報伝達手段とは限らないことを心に留めておく必要があります。

バブルチャートの代替手法

散布図

バブルチャートの代わりに散布図があります。散布図はバブルチャートに似ていますが、2つの変数しか表現できません。例えば、電子機器の購入価格と家具の購入価格のみを示すことができます。しかし、この2つの変数だけでは興味深い、あるいは的確な情報は示すことができないので、バブルプロットが提供する関連性の情報が有用です。

カテゴリカルカラムチャート

バブルチャートとは全く異なる外観をしていますが、カテゴリカルカラムチャートは意図という点で類似しています。バーチャートを使用して直接、値を比較し、効率的な意思決定を支援する情報を提供します。値と値の比の差が簡単に見れます。

チェリーチャート

チェリーチャートとは、散布図と同様の方法でプロットされるシンプルなチャートで、バブルの大きさの代わりに「茎」の長さで値を表示します。これは、重なるデータがある場合には、それらのデータが見えにくくなるという、バブルチャートと同様の問題がありますが、傾向や効果の大きさを素早く把握することができます。

関連製品

  • Spotfire
    組織全体でのデータ分析・活用を実現するオールインワンのデータ分析ソフトウェア
    詳しく見る
探索的分析/原因分析の領域で
高い評価と実績
TIBCO Spotfire

Spotfireは分析に必要な機能を単一製品でカバーするビジュアルアナリティクスツールです。

Spotfire® 組織全体でのデータ分析・活用をオールインワンで実現するビジュアルアナリティクスツール 無料トライアル実施中
Spotfireの機能・使い方を動画で学べる Spotfire活用セミナー アーカイブ動画配信中 セミナー動画視聴はこちら
あ行
イーティーエル
(ETL)
異常検知
(Anomaly Detection)
か行
回帰分析
(Regression Analysis)
機械学習
(Machine Learning)
クラスター分析
(Cluster Analysis)
根本原因分析
(Root Cause Analysis)
さ行
散布図
(Scatter Chart)
製造アナリティクス
(Manufacturing Analytics)
た行
ダッシュボード
(Dashboard)
データ移行
(Data Migration)
データ仮想化
(Data Virtualization)
データカタログ
(Data Catalog)
データガバナンス
(Data Governance)
データクレンジング
(Data Cleansing)
データサイエンス
(Data Science)
データサイエンティスト
(Data Scientist)
データサイロ
(Data Silo)
データセキュリティ
(Data Security)
データ統合
(Data Integration)
データ品質
(Data Quality)
データファブリック
(Data Fabric)
データフェデレーション
(Data Federation)
データ分析
(Data Analytics)
データマネジメント
(Data Management)
データマネジメントプラットフォーム
(Data Management Platform)
データメッシュ
(Data Mesh)
データモデリング
(Data Modeling)
データリンキング
(Data Linking)
データレイク
(Data Lake)
テキストマイニング
(Text Mining)
デジタルツイン
(Digital Twin)
デブオプス
(DevOps)
統計的工程管理
(SPC)
は行
バッチ処理
(Batch Processing)
バブルチャート
(Bubble Chart)
パレート図
(Pareto Chart)
ビジネス用語集
(Business Glossary)
ビジュアルアナリティクス
(Visual Analytics)
分散分析
(Anova)
ま行
マスターデータ
(Master Data)
マスターデータ管理
(Master Data Management)
マルチドメインMDM
(Multi Domain MDM)
メタデータ管理
(Metadata Management)
や行
予測分析
(Predictive Analytics)
ら行
リアルタイム分析
(Real-time Analytics)
リファレンスデータ
(Reference Data)
レーダーチャート
(Radar Chart)
レストフルエーピーアイ
(RESTful API)
ロジカルデータウェアハウス
(Logical Data Warehouse)
ロジスティック回帰
(Logistic Regression)
論理データモデル
(Logical Data Model)