ウィルコクソンの符号順位検定をExploratoryで行う

ウィルコクソンの符号順位検定は、データの分布が正規分布であることなど、t検定で必要とされる仮定が満たされないときに、代わりに使われます。

この記事では、Exploratoryでウィルコクソンの符号順位検定を行ってみます。

Rに付属のairqualityデータ(大気の状態のデータ)から、5 月と8月のデータ(Month列の数値が月)をこちらに抜き出しました。

オゾンのレベルが、5月と8月で有意に異なるのか検定してみましょう。

カスタムRコマンドのステップを追加して、ウィルコクソン検定のモデルを、データフレームの列として作成します。プラス(+)アイコンをクリックして現れるメニューから、カスタムRコマンドを選びます。

カスタムRコマンドダイアログが現れます。以下のRコマンドを入力します。

do(model=wilcox.test(Ozone~Month, data=.))

実行ボタンをクリックすると、以下のように、model列を持ったデータフレームのステップが生成されます。

テスト結果を抽出するには、以下のコマンドを実行するカスタムステップを追加します。

tidy(model)

tidyは、BroomというRパッケージの関数です。Broomパッケージは、統計・機械学習モデルを、tidyな形のデータフレームとして取り扱うための便利な関数のセットを提供しています。今回使用するtidy関数は、モデルの情報を抜き出してデータフレームにするものです。


このステップが実行されると、テスト結果のサマリ情報を持ったステップが生成されます。

P値(p.value列)は非常に小さく、月が8月なのか5月なのかは、オゾンレベルに有意に影響を持っていると言えます。