Exploratoryでは、複数の条件を持つデータ集計が必要な場面がよくあります。例えば、特定の売上金額と注文回数の両方の条件を満たす顧客のみを対象にした分析を行いたい場合などです。
今回は、sumif関数を使用して複数の条件を設定し、特定の条件を満たすデータのみを集計する方法について説明します。特に「売上が1000ドル以上」かつ「注文回数が2回以上」という複数条件を組み合わせたデータ集計方法を紹介します。
値を集計する際に、単一の条件設定はUIから簡単に行えますが、複数の条件(例:売上額と注文回数の両方)を組み合わせて集計を行いたい。
まず、単一条件での集計方法を確認します。例えば、売上が1000ドル以上の顧客だけに絞った売上合計を求めたい場合は以下の手順で行います。
今回はチャートの集計テーブルを例にして紹介いたしますが、他のチャートでも同様の設定となります。
値の部分に「売上」を選択し、集計関数から下にスクロールして「条件付き合計値(sumif)」を選択します。
条件設定のダイアログが表示されるので、列に「売上」、演算子に「以上」、値に「1000」と入力して実行します。
これにより、売上が1000ドル以上の顧客のみの売上合計がマーケットごとに表示されます。
次に、複数条件(売上が1000ドル以上かつ注文回数が2回以上)での集計方法を説明します。
チャートの集計テーブルで、値に「カスタム」を選択します。
「カスタムの計算を作成」ダイアログが表示されます。ここでは手動で計算式を記述します。
計算式の入力欄に「sumif」関数を使用して以下の式を入力します。
sum_if(売上, 売上 >= 1000 & 注文回数 >= 2, na.rm=TRUE)
この式では、2つの条件をANDによって繋げることで、2つの条件に合致する場合といった指定にしています。
また、データに欠損値が含まれる可能性がある場合は、「na.rm=TRUE」を追加します。これにより欠損値を除外して計算が行われます。
これにより、売上が1000ドル以上かつ注文回数が2回以上という複数の条件を満たす顧客のみの売上合計が、マーケットごとに表示されます。