Exploratory アワー #800 -ピボットテーブル: 複数列の集計値を使った指標を計算したい

Exploratoryのピボットテーブルには、集計された値をさらに計算できる「カスタム計算」機能があります。この機能を使うことで、データ加工のステップを追加することなく、集計テーブル上で複数の集計値を組み合わせた指標を計算できます。

役立つ人

集計テーブルやピボットテーブルで複数列の集計値を組み合わせた指標を計算したい方、ダッシュボードやノートに正確な集計指標を表示したい方にお役立ていただける機能です。

問題

「売上合計 / 数量」のように複数の集計値を組み合わせた「商品単価」のような指標を、あらかじめカテゴリーごとに集計していて、それをピボットテーブル上で再度可視化した際、単に計算済み商品単価を集計するだけでは、正しい計算結果を得られません。

例えば、商品単価の平均値を集計した場合、期待する数値とは異なる結果になってしまいます。

解決方法

ピボットテーブルで商品単価のような集計指標を出す際、値の集計方法に「平均」を選ぶと、合計値では、各行の商品単価の平均を取ることになります。

しかし、本来求めたいのは「売上合計の総和 / 数量の総和」です。これらは異なる計算であるため、平均を使うと正しい結果が得られません。

この問題を解決するには、ピボットテーブルの「カスタム計算」機能を使います。なお、今回利用するデータはこちらからダウンロードいただけます。

カスタム計算では、sum(売上合計) / sum(数量) のように、集計関数を使って各列の集計値を求め、それらを組み合わせた計算式を記述することができます。

これにより、データ加工のステップを追加することなく、ピボットテーブル上で正確な指標を算出することが可能です。

また、元のデータに欠損値が含まれる場合に備えて、集計関数に na.rm = TRUE を指定しておくことで、欠損値を除外した上で正しく集計を行うことができます。

ビデオ

参考情報

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio