統計的検定を一気に実行する方法

例えば、t検定で性別ごとにアンケートの質問項目の平均値に差があるかを確認したいとします。

以下の顧客満足度調査のデータでは10個の質問項目があり、それぞれの質問項目ごとに列が存在しています。

このデータで検定を実行しようとすると、目的変数にそれぞれの質問項目の列を割り当てていく必要があるため、通常なら10回の検定処理が必要となり時間がかかってしまいます。

この仮説検定をもっと効率的に行う方法として、データの形を変換することで可能です。

このデータは質問ごとに列があるワイド型のデータとなっているために、目的変数に対して1列ずつ割り当てる必要がありました。

では、これを質問と回答にまとめたロング型のデータに変換をしていたとします。これによって目的変数に対して「回答」を、繰り返しに対して「質問」を割り当てることができ、一気に検定を実行することができるようになります。

ロング型に変換するためには、複数の列をシフトキーで選び、列ヘッダメニューから「ワイド型からロング型へ」の「選択された範囲」を選びます。

ワイド型からロング型へのダイアログが表示されるため、キーと値の列に以下の列名を指定します。

  • キー列: 質問
  • 値の列: 回答

これによってデータの形を質問と回答の2つにまとめたロング型のデータに変換できました。

では、このデータを使って仮説検定を一気に実行するために、以下のように列を指定します。この例ではt検定を使った方法として紹介します。

  • 目的変数: 回答
  • 説明変数: 性別(その他の2値変数でも可能)
  • 繰り返し: 質問

実行することで、10回行う必要があった仮説検定一括で実行することができました。

まとめ

アンケート調査や実験データなど、同種の測定項目が複数ある場合には、今回紹介したようにロング型に変換することで、一気に検定を実行することができ、分析時間を大幅に短縮し、より包括的な洞察を得ることが可能になります。

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio