ウィルコクソン検定の紹介

ウィルコクソン検定(ウィルコクソンの順位和検定)とは、データの元の分布が正規分布であるという前提がないノンパラメトリック検定の一つで、「2つ」のグループ間の分布に違いがあるかを検定することができます。

例えば、男性と女性の給料の分布を可視化したヒストグラムがあったとします。

このとき、男性と女性の給料は完全に同じような分布はしていませんが、例えば、2000ドルから3000ドルの間の給料をもらっている人が最も多い点など、同じような分布をしているように見え、この分布の差が意味のある違いなのかどうかはこのヒストグラムからでは判断できません。

そこで、2つのグループの分布に意味のある違いがあるのかどうかを知るために、ウィルコクソン検定を使って検証することができます。

サンプルデータ

今回はサンプルデータとして、従業員データを使用していきます。

このデータは1行が1従業員のデータで、列には年齢や給料、職種など従業員の属性を表す列があります。

ウィルコクソン検定を実行する

今回は、「男性」と「女性」で「給料」の分布に統計的に有意な差があるのかをウィルコクソン検定で確認します。

なお、「性別」には一意な値の数が2つあり「男性」と「女性」というカテゴリーが存在します。

アナリティクスビューを開き、タイプに「ウィルコクソン検定」を選択します。

目的変数に「給料」を選び、説明変数に「性別」を選択し、実行ボタンをクリックします。

これにより、性別が「男性」と「女性」の給料の分布の違いが有意かどうか調べるためのウィルコクソン検定が実行されました。

結果の解釈

サマリ

「サマリ」タブでは、検定の結果が有意かどうかを確認できます。2つ のグループの、元の分布に差がないことを前提とした時に、この結果が得られる確率を表すP値から有意かどうか判断ができ、一般的には0.05(5%)を下回ると有意であると言われています。

確率分布

「確率分布」タブでは、ウィルコクソン検定で使用する確率分布である「U分布」を描き、今回の結果である「U値」がU分布の中でどの位置にあるのかを点線で表示します。

エラーバー

「エラーバー」のタブでは、グループごとの平均値とその信頼区間がエラーバーとして可視化されます。

データの分布

「データの分布」のタブでは、目的変数に設定した変数の密度曲線がグループごとに可視化されます。

統計量

「統計量」のタブでは各カテゴリー、平均値などの統計量が表示されます。

参考資料

ウィルコクソン検定に関する参考資料は下記をご覧ください。

  • ウィルコクソンの順位和検定の効果量 - リンク
Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio