アンケートで一つの質問に対して複数の回答がある場合に、回答ごとに列を作る方法

今回はアンケートデータを使用します。

このデータは1行1回答者のデータとなっていて、列には商品を知ったきっかけという列があります。

広告やSNSのように一つの回答だけをしている人もいれば、店頭と知り合いからのように複数回答している人もいます。

このように複数回答ができる質問は、ロング型とワイド型の2つのデータの持ち方ができます。

回答が一つの列にまとまっていて縦長になっているデータのことをロング型と言います。

次に、回答ごとに列があるため横長になっていくデータのことをワイド型と言います。

例えば、ロング型のデータの時の中村さんは、商品を知ったきっかけの列をみると「店頭」と回答していることがわかります。

ワイド型では、店頭だけ1の値があり、それ以外のSNSや広告などの列は0になっています。

ロング型はひとつの列として扱えることで、チャートなどで可視化しやすいです。

ワイド型のデータでは回答ごとに列を作ることができるため、回答間の関係性を調べることができます。

そこで今回は、一つの質問に対して複数の回答がある列から、回答ごとに列を作りたい。つまりロング型からワイド型へ変換していきたいです。

ちなみに、Exploratoryでは、ロング型からワイド型へ(Spread)という機能を使うと簡単にワイド型にできます。

ところで、今回のデータは1行1回答者ですが、この状態でロング型からワイド型にするとどうなるのでしょうか。。

この場合だと、複数回答の値が列として作られてしまいます。

理由としては、複数回答が含まれているセルがあるからです。

そのため、1行1回答者から1行1回答に変換する必要があります。

列ヘッダメニューから分割の…で行に分割を選び、区切り文字にコンマ(,)を指定します。

行に分割のダイアログが表示されるため、そのまま実行ボタンをクリックします。

回答ごとに行を分割することで、1行1回答にすることができました。

サマリ・ビューをみると、広告から商品を知った人が多いことがわかります。

次に、ロング型からワイド型にしていきたいのですが、ワイド型へ変換するには、キー列と値の列の2つの列が必要になります。

上記の例では、アンケートデータの質問と回答(5段階評価)がそれぞれ列にあるロング型のデータです。

ワイド型に変換すると、キー列は列名になり、値の列はそれぞれの回答(5段階評価)になります。

しかし、今回のデータではキー列はありますが、値の列はありません。

そのため、ワイド型に変換する際に必要なダミーの値の列を作成していきます。

列ヘッダメニューから計算を作成を選択します。

計算を作成のダイアログが表示されました。

計算エディタに1を入力します。

値の列を作成することができました。

それでは、キー列と値の列の準備が整ったのでワイド型に変換していきます。

商品を知ったきっかけの列と値の列Commandキー(ctrlキー)でを選び、列ヘッダメニューからロング型からワイド型へを選択します。

ロング型からワイド型へのダイアログが表示されるため、そのまま実行します。

回答ごとに列を作ることができました。

しかし、値がないデータが欠損値<NA>になっているので、0で埋めたいです。

ロング型からワイド型へのトークンをクリックします。

欠損値を…で埋めるに0を指定します。

欠損値を0で埋めることができました。

値がそのまま列名になっているため、他の人にデータを共有する際には元の質問がわからなくなってしまいます。

列名を接続する文字列にアンダーバー( _ )を指定します。

それぞれの回答の列名に、元の列名が追加されました。

回答ごとに列を作ったデータで相関を調べる

散布図でトレンドラインの線形回帰を引くことで相関関係があるか調べることができます。

例えば、相関係数が0.93だったとします。

相関は-1から1の値を取ります。

1に近ければ正の相関があり、-1に近ければ負の相関があります。0に近い時にはこれらの変数には相関がないと言えます。

となると、先ほどの2つの変数には強い相関関係(0.93)があると言えます。

散布図を一つ一つ作って相関関係を調べていくのも良いですが、全ての変数で総当たりで相関係数をみたいです。

アナリティクス・ビューからタイプに相関を選び、変数の列を選択します。

全ての数値列を選択してOKボタンをクリックします。

実行ボタンをクリックします。

全ての変数ごとの相関を求めることができました。

商品を知ったきっかけが店頭とSNSでは負の相関(-0.48)があるのがわかります。

商品を知ったきっかけが知り合いからの場合、他の人へ商品を薦めたいとやや強い正の相関(0.67)があるようです。