ExploratoryのUIでは、二郡のt検定をサポートしていますが、一群のt検定は現在のVersion 5.5ではUIによるサポートはありません。
しかし、カスタムRコマンドを使えば、一群のt検定を含むUIによるサポートがない検定も行うことが可能です。
この記事では、Exploratoryで一群のt検定を行ってみます。
例として、アメリカ国内線の飛行機のフライトデータから、5000件をサンプルとして抽出してみました。 このサンプルデータから、飛行機の到着遅れの平均は、0から有意に異なるのか検定してみます。
カスタムRコマンドのステップを追加して、一群のt検定のモデルを、データフレームの列として作成します。プラス(+)アイコンをクリックして現れるメニューから、カスタムRコマンドを選びます。
カスタムRコマンドダイアログが現れます。一群のt検定のモデルを作成するために、以下のRコマンドを入力します。
do(model=t.test(.$ARR_DELAY, mu = 0, alternative = "two.sided", data=.))
実行ボタンをクリックすると、以下のように、model列を持ったデータフレームのステップが生成されます。
テスト結果を抽出するには、以下のコマンドを実行するカスタムステップを追加します。
model_info(model, output="summary")
model_infoは、BroomというRパッケージの関数(今回はglanceという関数)をデータフレームの列に格納されたモデルに対して呼び出すためのExploratoryの関数です。Broomパッケージは、統計・機械学習モデルを、tidyな形のデータフレームとして取り扱うための便利な関数のセットを提供しています。今回使用するglance関数は、モデルの情報を抜き出して1行のデータフレームにまとめるものです。
このステップが実行されると、テスト結果のサマリ情報を持ったステップが生成されます。
P値(p.value列)は一般的にしきい値として使われる0.05よりもかなり小さく、このサンプルデータから、飛行機の平均的な到着遅れは0とは有意に異なると言えます。