Two-Way ANOVA(二元配置分散分析)は、2つの異なる要因(独立変数)が1つの結果(従属変数)にどのように影響を与えているかを分析する手法です。この分析では、各要因の主効果だけでなく、2つの要因間の交互作用も検証することができます。例えば、年齢層と性別という2つの要因が購入金額にどのように影響を与えているのかを分析する際、年齢層による影響、性別による影響、そしてそれらの組み合わせによる特有の影響(交互作用)を同時に評価することができます。
Two-Way ANOVAの特徴的な点は、2つの要因の組み合わせによる相乗効果や打ち消し合う効果を発見できることです。例えば、一般的に年齢層が上がるほど購入金額が増加する傾向がある一方で、その増加パターンが性別によって異なるといった複雑な関係性を明らかにすることができます。これにより、単純な一要因の分析では見落としてしまう可能性のある重要なパターンや関係性を特定することが可能となります。
この分析手法の最大の利点は、複数の要因を同時に分析できることに加えて、それぞれの要因の効果の大きさを統計的に比較できる点にあります。例えば、購入金額の変動に対して年齢層と性別のどちらがより大きな影響を持っているのかを定量的に評価できます。また、交互作用の有無を確認することで、より効果的なマーケティング戦略の立案や、商品開発の方向性の決定など、実務的な意思決定に直接活用できる知見を得ることができます。
Two-Way ANOVAは、2つのカテゴリカルな要因が数値データにどのように影響を与えているかを理解したい場合に特に有効です。例えば、ECサイトでの商品の売れ行きを分析する際、商品カテゴリーと販売チャネルという2つの要因が売上金額にどのように影響しているかを分析できます。また、教育分野では、教授法と学習環境が学生の成績にどのように影響するかを調査する際にも活用できます。
ビジネスの現場では、新商品の開発やマーケティング戦略の立案時に、複数の要因の効果を同時に検証する必要がある場合に特に重宝します。例えば、広告の効果を測定する際に、広告の種類と表示時間帯という2つの要因が、クリック率にどのように影響するかを分析することができます。また、顧客満足度調査では、サービスの種類と顧客の属性が満足度にどのように影響するかを理解するのに役立ちます。
参考となるデータ例:
EC事業での使い方
教育サービスでの使い方
マーケティング担当者での使い方
商品開発担当者での使い方
今回は「小売業顧客購買データ」を使用します。データはこちらからダウンロードが可能となっています。
このデータは小売業の顧客購買データで、1行が1顧客の購買情報で、列には顧客ID、年齢層、性別などの属性情報に関するデータがあります。
Two-Way ANOVAを作るためには、以下のようなデータの構造が必要となります。
小売業顧客購買データから「アナリティクス・ビュー」を開きます。
タイプに「統計的検定」を選び、「Two-Way ANOVA (分散分析)」を選択します。
目的変数には、「購入金額」の列を割り当てます。
説明変数1には「年齢層」を、説明変数2には「性別」を割り当てます。
最後に、「実行」ボタンをクリックして実行結果を確認します。
Two-Way ANOVAでは、年齢層と性別が購入金額に与える影響を解釈するためにサマリや確率分布、多重比較などの情報があります。
「サマリ」タブでは分散分析の基本的な結果を確認できます。
年齢層、年齢層と性別の組み合わせはP値が0.05未満のため、統計的に有意な差があることがわかります。一方で、性別単体ではP値が0.197(20%程度)で統計的に有意であるとは言えない結果となっています。
「確率分布」をクリックすると、F分布上での検定統計量の位置を確認することができます。
この結果から、観測されたF値が棄却域に入っているため帰無仮説を棄却でき、統計的に有意であると判断できます。
「多重比較 (変数)」をクリックすると、各年齢層間、性別間での購入金額の差の統計的有意性を確認することができます。
例えば、20代の購入金額は他のすべての年齢層と比較して有意に低く(P値は2.42e-13)、特に40代との差が最も大きく約14,000円の差があることがわかります。
「多重比較 (交互作用)」をクリックすると、年齢層と性別の組み合わせによる購入金額の差の統計的有意性を確認することができます。
例えば、40代女性は他のほとんどの年齢・性別グループと比較して有意に高い購入金額を示しており、特に20代男性との差が最も大きく約15,130円の差があることがわかります。
「平均値 (ライン)」をクリックすると、各要因の水準ごとの購入金額の平均値をラインで確認することができます。
購入金額は両性別とも40代でピークを迎え、女性の方が全年齢層で購入金額が高い傾向を示していることが確認できます。
Two-Way ANOVAは、2つのカテゴリカルな要因が数値データに与える影響を包括的に分析できる強力な手法です。今回の分析例では、年齢層と性別という2つの要因が購入金額に与える影響を検証し、それぞれの主効果だけでなく、要因間の交互作用も明らかにすることができました。特に、30代・40代の女性が重要な顧客セグメントであることが統計的に示され、このような知見は効果的なマーケティング戦略の立案に直接活用することができます。