コレスポンデンス分析の活用事例を使ってわかりやすく解説

1.コレスポンデンス分析とは

コレスポンデンス分析とは、多次元集計されたデータを多次元空間にマッピングして、データ要素同士の関係性を視覚的に表現する分析手法です。
もう少し分かりやすい表現にすると、”コレスポンデンス分析とはクロス表の結果をひと目で分かるようグラフに表現する分析手法”です。

厳密にはテーブルデータであればクロス集計表以外でも分析を実行することは可能です。
しかしクロス集計表以外では他にも優秀な分析手法があるため、コレスポンデンス分析はクロス集計表に対して行われることが多いです。

それでは簡単な例を使用して、コレスポンデンス分析がどのような分析でどのようなグラフが作れるのか、解説していきましょう。

コレスポンデンス分析の例

以下の表は20代〜40代の男女各100名ずつに行われたアンケートをクロス集計したものです。

「スポーツウェアを選ぶ際に重視している点は何か?」という質問に対して当てはまるものを1つ以上(複数回答可)選択して頂きました。
項目は”伸縮性”、”デザイン”、”速乾性”、”ブランド”、”値段”の5項目です。
各数字を細かく見ていくと、各年代や男女で差があるのが分かります。

しかしこのままでは分かりにくいため、コレスポンデンス分析でこのクロス集計表をグラフで表現してみます。
コレスポンデンス分析を実施したところ、以下のグラフが完成しました。

コレスポンデンス分析で作成したグラフは、関係の強い要素同士は近く、関係の弱い要素同士は遠くに配置されるようになっています。
このグラフをみるとデザインのそばに20代〜40代の女性が配置されており、女性が”デザイン”を重視してスポーツウェアを選んでいるのが分かります。
また男性は、”伸縮性”や”速乾性”など機能性を重視していることが分かります。
”値段”に注目してみると、20代女性や30代女性、20代男性と近い位置にあり、若い世代は値段を重視していることが分かります。
反対に”ブランド”は40代の男女と近い位置にあり、比較的年配の世代に重視されているようです。

いかがでしょうか。このようにコレスポンデンス分析によって、クロス集計をグラフにして解釈しやすくすることができます。

2.コレスポンデンス分析のメリット

クロス集計表の解釈が容易になる

データを使った分析をする際に、クロス集計表を活用する方は多いと思います。
でもクロス集計表は、ひと目で結果の解釈がしにくいという欠点があります。
コレスポンデンス分析はクロス集計表を視覚的に分かりやすく表現することができます。
そのため列数や行数が多いクロス集計表に使用したり、プレゼンに使うスライドで使用したり、様々な活用ができます。

グループ毎の関係性を距離で表現できる

コレスポンデンス分析を使用することで、どのグループとどのグループが強い関連を持つのか、ひと目で分かるようになります。
コレスポンデンス分析のグラフは距離が近ければ近いほど、そのグループとそのグループが強く関係することを示すからです。
クロス集計表の状態ではどのグループとどのグループがどの程度の関係を持つのか知ることはできません。
グループ間の距離をみることで、グループ感の関係性を理解できる点もコレスポンデンス分析のメリットです。

3.コレスポンデンス分析の注意点

必ずしも正しくグラフ化できるわけではない

コレスポンデンス分析は分かりやすさを重視しているため、時に正しくグラフ化ができていないことがあります。
冒頭で使用した例を見てみましょう。

この結果を見ると、”デザイン”に一番近いグループは30代女性です。
そのため一見「30代女性が一番デザインを重視している」と解釈してしまいがちです。
クロス集計表をもう一度確認してみましょう。

クロス集計表の結果を見ると、”デザイン”を重視しているのは30代女性よりも20代女性です。
20代女性は”デザイン”だけでなく”値段”も重視する傾向があるため、30代女性の方が”デザイン”に近い位置になったようです。
確かに”デザイン”と”値段”を重視する20代女性よりも”デザイン”だけを重視する30代女性の方が、”デザイン”と関係が強いという解釈もできます。

このようにコレスポンデンス分析で可視化したグラフは、直感と一致しないこともあるため注意が必要です。
コレスポンデンス分析の強みは、全体の傾向をざっくりとつかみたい時です。
コレスポンデンス分析で得られた結果を詳しく検証する時は、必ずクロス集計表の結果も一緒に活用するようにしましょう。

横軸と縦軸の意味は自身で考察しなければならない

コレスポンデンス分析の結果をみると、横軸と縦軸が設定されています。
横軸と縦軸はそのデータの何らかの特性を示しています。
しかしこれらの軸が何を意味するかは自身で考えなければなりません。
冒頭の例を再び確認してみましょう。

横軸に注目すると、右側には”デザイン”が、左側には”伸縮性”と”速乾性”が位置しています。
見た目を重視すると機能性が犠牲になることを想定すると、横軸はどうやら「見た目」を表す軸であるようです。
次に縦軸に注目してみましょう。
上側には”ブランド”が、下側には”値段”が位置しています。
良いブランドの商品は相対的に値段が高いことを想定すると、縦軸は「ブランド力」を表す軸であるようです。
このように解釈すると、このグラフで右側に位置すればするほど「見た目」を重視するグループであり、上側に位置すればするほど「ブランド力」を重視したグループであると考えられます。

このように横軸と縦軸の意味を考察すると、より多くのことが分かります。
しかしその反面、横軸と縦軸が何を意味するのかは自身で考察しなければならないため、注意しましょう。

結果の解釈が難しいこともある

コレスポンデンス分析を実施すれば、”必ずしも”分かりやすくなるわけではありません。
元々の仮説と一致しない結果になることや、説明のつかない結果になることもあります。
しかし結果がおかしい場合は、分析に使用した元データ(クロス集計表)に問題があることがほとんどです。
そのため結果の解釈が難しい場合は、まずはデータの見直しを行いましょう。
それでも改善できない場合は別の分析手法を試すなどの対策が必要になります。
これはどの分析手法にも当てはまることですが、コレスポンデンス分析もどのようなデータに対しても万能な分析手法ではない点は留意しておきましょう。

4.コレスポンデンス分析を活用した事例

ある自動車販売メーカーがブランドポジショニングを分析することにしました。
車の各メーカーの市場での立ち位置や、消費者の行動特性を知ることが目的です。
そこでまずは20代〜60代までの男女各100名ずつに各ブランドのイメージをアンケートすることにしました。
設問は「新しく車を購入する際に検討するメーカーはどこか?(複数回答可」としました。
アンケート結果をクロス集計表にまとめ、分かりやすくするためにコレスポンデンス分析を実施することにしました。
以下が分析結果をグラフにしたものです。

よりグラフを見やすくするために、男性を青、女性を赤に配色しました。

まずは横軸と縦軸の意味を考察してみましょう。
横軸に注目すると、右側には男性、左側には女性のグループが集中していることが分かります。
そのため横軸はそのメーカーが男性向きか女性向きかを示すものだと解釈できます。
縦軸に注目すると、下から上に上がるにつれて、年齢が若くなる傾向があります。
そのため縦軸はそのメーカーが若者向きかシニア向きかを示すものだと解釈できます。
つまりグラフの左上にあるメーカーは「比較的若い女性向き」であり、グラフの左下のメーカーは「シニアの男性向き」であると解釈できそうです。
そのように解釈すると、“メルセデスベンツ”はシニアの男性に人気があることが分かります。
”ダイハツ”や”フォルクスワーゲン”はおしゃれなイメージが有るためか若い女性に人気があるようです。

このようにコレスポンデンス分析を使用することで、各自動車メーカーのポジションや消費者の特性を知ることができました。
この結果は営業やマーケティングに活かせそうですね。

5.クラスター分析や主成分分析との違い

各分析の目的の違い

ある程度データ分析に精通した方は、クラスター分析や主成分分析とコレスポンデンス分析が似ていることに気づいたかもしれません。
これらの分析手法の最大の違いは、分析を行う目的です。
以下に各分析の目的を簡単にまとめました。

  • コレスポンデンス分析:クロス集計表を可視化して見やすくする
  • クラスター分析:類似性の高いデータをグルーピングする
  • 主成分分析:データ全体を集約して変数(列数)を減らす

クラスター分析と主成分分析についてもう少し詳しく見ていきましょう。

クラスター分析とコレスポンデンス分析の違い

クラスター分析とコレスポンデンス分析の最大の違いは、分析前にグルーピングができているか否かです。

クラスター分析は似ているデータ同士を集めてグループを作成する分析手法です。
そのためどのようなグループが作成されるかは、分析を行ってみないと分かりません。
分析後に各グループの特性を考察していかなければならない点で、クラスター分析は分析後のひと手間が必要になります。

これに対してコレスポンデンス分析はあらかじめグループを分けた上で分析を実行します。
冒頭で挙げた例でも予め”20代男性”、”30代男性”といったグループに分けていました。
そのため事前に決まったグループの特徴を分析する場合はコレスポンデンス分析が適切です。

どんなグループ分けをするのが適切か不明な場合はクラスター分析によってグループを作るのが良いでしょう。
もちろんクラスター分析で作成したグループを使ってコレスポンデンス分析を行う、という合わせ技を用いることも出来ます。
目的に応じて上手に使い分けましょう。

主成分分析とコレスポンデンス分析の違い

コレスポンデンス分析も主成分分析も、複数の変数を持つデータを2次元のグラフに可視化できるという点で非常に似ています。
冒頭に提示した例を使ってコレスポンデンス分析と主成分分析の結果を比較してみましょう。
上のグラフはコレスポンデンス分析、下のグラフは主成分分析の結果です。

主成分分析は赤い矢印の方向に進めば進むほど、その項目を重視したグループであることを示しています。
コレスポンデンス分析のほうが見やすいと感じた方が多いのではないでしょうか。
なぜなら主成分分析は各矢印の向きを考慮して各グループの特性を考察しなければならないのに対して、コレスポンデンス分析はグループ間の近さを見るだけで特性が分かるようになっているからです。

たとえば”デザイン”を重視するグループを知りたい時、コレスポンデンス分析では30代女性が近いためひと目で分かります。
しかし主成分分析の場合、”デザイン”の矢印をみて、その矢印から一番遠い位置にあるグループを探す必要があります。
コレスポンデンス分析は、グラフ上近いものは類似性が高いという直感的な理解ができるという点で、主成分分析より優れています。

そのため分析の目的が「結果の見やすさ」である場合、主成分分析よりコレスポンデンス分析の方が適切です。
なお、分析の目的が「結果の見やすさ」ではなく「データを集約して変数を減らすこと」である場合は、主成分分析の方が優れているため注意しましょう。

6.まとめ

最後におさらいをしましょう。

  • コレスポンデンス分析とはクロス表の結果をひと目で分かるようグラフに表現する分析手法
  • コレスポンデンス分析を用いることでグループや変数の関係性を距離で示すことができ、データの解釈が容易になるというメリットがある
  • あくまでも見やすさを重視するため、クロス集計表から得られる解釈と異なる結果になることもある点に注意が必要
  • グラフの縦軸と横軸の意味は自身で考察しなければならないため注意が必要
  • クラスター分析や主成分分析とは分析を行う目的が異なるため、目的に応じた使い分けが必要

クロス集計表はあらゆる分野の現場でよく使われるため、コレスポンデンス分析が活用できる場面は多くあります。
コレスポンデンス分析を上手に活用すれば、データ分析を効率的にするだけでなくプレゼンテーションの場でも結果の説明が簡単になります。
使ったことがない方は、ぜひ活用を検討してみてください。

最後までお読みいただきありがとうございました。