2-way ANOVA(分散分析)をExploratoryで行う

この記事では、Exploratoryで2-way ANOVAを行ってみます。

Rに付属のmtcarsデータ(自動車のデータ)から、燃費の良さ(mpg)、シリンダー数(cyl)、ギア数(gear)をこちらに抜き出しました。

シリンダー数とギア数をカテゴリーとして見たときに、これらの燃費に対する影響を2-way ANOVAで検定してみます。

カスタムRコマンドのステップを追加して、ANOVAのモデルを、データフレームの列として作成します。プラス(+)アイコンをクリックして現れるメニューから、カスタムRコマンドを選びます。

カスタムRコマンドダイアログが現れます。以下のRコマンドを入力します。

do(model = aov(mpg ~ cyl + gear, data = .))

実行ボタンをクリックすると、以下のように、model列を持ったデータフレームのステップが生成されます。

テスト結果を抽出するには、以下のコマンドを実行するカスタムステップを追加します。

tidy(model)

tidyは、BroomというRパッケージの関数です。Broomパッケージは、統計・機械学習モデルを、tidyな形のデータフレームとして取り扱うための便利な関数のセットを提供しています。今回使用するtidy関数は、モデルの情報を抜き出してデータフレームにするものです。


このステップが実行されると、テスト結果のサマリ情報を持ったステップが生成されます。

シリンダー数(termがcylの行)のP値(p.value列)は非常に小さく、シリンダーの数は、燃費の良さに有意に影響を持っていると言えます。 ギア数(termがgearの行)のP値は0.68と大きく、ギア数は燃費の良さに有意に影響を持っているとは言えないことが見てとれます。