データの統計情報をグループごとにもとめる

例えば、下記のような1行が1売り上げをあらわす売り上げのデータがあるとします。このデータを、地域(Region)ごとにグループ化して、売り上げ(Sales)の平均や標準偏差といった、基本的な統計情報をもとめる方法を紹介いたします。

1. ピボットテーブルを使う

簡単な方法として、ピボットテーブルを使うやり方があります。

  • チャート・ビューに行き、チャートを作成
  • タイプにピボットテーブルを選択
  • 行にRegionを選択
  • 値にSalesを選択

すると、RegionごとSalesの合計値がに表示されます。ここで、Salesの横のSUMという文字をクリックすると、集計関数の一覧があらわれますので、ここで使いたい関数を選びます。

Sales列を追加することで、いくつもの統計情報を同時に得ることができます。以下の例は、平均 (AVG)、中央値 (MED)、標準偏差 (SD) を求めた例です。

2. データ・ラングリングでもとめる

次に、データを加工(ラングリング)してもとめる方法を紹介します。まず、地域 (Region) でデータをグループ化します。テーブル・ビューに行き、Region列の列ヘッダメニューからグループ化を選択します。

次に、グループごとに値を集計します。まずは平均値をもとめてみましょう。Sales列の列ヘッダメニューから集計を選択し、平均値を選択します。

すると、集計のダイアログがあらわれます。既に必要な値は入っているので、そのまま実行ボタンを押します。

すると、グループごとに平均値が集計されて表示されます。新たに統計情報を計算したい場合は、テーブルの列名の横にある+ボタンをクリックします。

すると、先ほどの集計のダイアログが表示されますので、使いたい関数を選び、列名を入力して実行します。

以下の例は、平均 (Sales_mean)、中央値 (Sales_median)、標準偏差 (Sales_sd) を求めた例です。