対応分析（コレスポンデンス分析）の紹介

対応（コレスポンデンス）分析はアンケートデータの分析をするときによく利用される手法の1つです。

対応分析を利用すると、順序関係がないカテゴリ型の回答を得られるアンケートの質問間の関係や、回答の特徴を直感的に理解することが可能です。

必要なデータの形式

対応分析には、1行が1人の回答者の1つの事柄（例: 製品・サービス・会社など）への評価となっているようなデータが必要です。また変数には文字列型のデータ型のみを選択できます。

今回はサンプルデータとして、「ビールを購入するときに最も重要に考えること」に関するアンケートのデータを使用します。このデータは、1行が1人の回答者を表していて、列には年代や最も重要に考える要素があります。

対応分析（コレスポンデンス分析）を実行する

アナリティクスビューを開き、タイプに「対応分析」を選択します。

変数の列をクリックして、対応分析に使用する列を選択します。

今回は「年代」と「要素」を選択します。

列の指定が完了したら実行することで、対応分析の結果が表示されます。

結果の解釈

変数の値（カテゴリー）どうしの関係

変数の値（カテゴリー）どうしの関係のセクションでは、2つの次元（次元1、次元2）によって、各変数のカテゴリの関係を可視化したチャートが表示されます。

点は1つ1つの変数のカテゴリーを表しており、色はそれぞれの変数（列）を表しています。

例えば、青色の「年代」に注目すると、20代、30代の回答の傾向は似ているため近いことが分かります。

また「年代」と「要素」の関係に注目すると、「20代と30代」は「アルコール度数」の近くに表示されているため、これらの世代の特徴は「アルコール度数」を重要と考えている（アルコール度数と回答する人の割合が大きい）ことがわかります。

続いて「40代」や「50代」に注目すると両者の回答の傾向は似ているため近くに表示されています。この世代の特徴は「味わい」を重要と考えていることであるため、「味わい」の近くに表示されるわけです。

最後に60代に他と比べて回答傾向が異なるため他の世代とは離れて表示されています。この世代の特徴は「サイズ」と「値段」を重要と考えていることであるため、近くに表示されるわけです。

重み

重みのセクションでは、次元ごとの各変数の重み（その次元が変数に与える影響の強さ）が表示されます。重みは0-100の間をとり、各次元のカテゴリーを全て足すと100になります。

例えば、次元1でソートすると、「アルコール度数」や「味わい」の重みが大きくなっており、これはX軸である次元1において、それらのカテゴリーの特徴をうまく説明できていることがわかります。

寄与率

寄与率のセクションでは、対応分析で作られた軸によって元データの情報量（ばらつき）をどれだけ表現できるかを確認できます。

寄与率はそれぞれの次元での情報量の表現できている割合で、累積寄与率はそれらの寄与率を足し上げて行った時にどれだけ表現できているのかがわかります。

AI サマリを使って分析結果を要約

v13で新しく追加されたAIサマリ機能では、対応分析の結果を自動的に要約してくれます。

使い方は驚くほど簡単で、対応分析を実行した後に「AIサマリ」のボタンを押すだけです。

これによって対応分析の「変数の値同士の関係」を文章として説明した結果が出力されます。

このAIサマリを見るだけで、対応分析での結果を「自分」で解釈しなくても、どういった特徴があるのかをAIが判断して教えてくれるために、誰でも簡単に対応分析を使えるようになります。

多重対応分析（コレスポンデンス分析）を実行する

これまで紹介してきた対応分析は、2変数のみの関係を可視化してきましたが、3つ以上の変数選択も可能です。

上記のように、変数を3つ以上選択している対応分析（コレスポンデンス分析）のことを「多重対応分析」や「多重コレスポンデンス分析」と呼ぶことがあります。

変数を3つ以上選択しても、結果の解釈の仕方に変わりなく、表示されている値が近しいカテゴリーには強い関係がある、一緒に回答されやすい傾向があると言えます。

上記の結果に対して、AIサマリを実行すると、以下のような結果を得られます。

例えば、「変数の値（カテゴリー）どうしの関係」の左半分からは以下のようなことがわかります。

このように複数の質問の関係性を理解できます。

参考資料

対応（コレスポンデンス）分析に関する参考資料は下記をご覧ください。

セミナー: 対応（コレスポンデンス）分析の紹介 - リンク

対応（コレスポンデンス）分析に関するよくある質問

対応（コレスポンデンス）分析について、よくある質問とその答えをこちらにまとめました。

Q: 対応（コレスポンデンス）分析のカテゴリータブで表示される、各カテゴリーの座標はどのように計算されていますか？

各カテゴリーの座標は、カテゴリ間の距離を元に決まっています。詳細は、こちらのオンラインセミナーで紹介していますので、ご参考ください。