集計データで信頼区間を求める方法

下記のような集計済みのデータで信頼区間を求めて可視化する方法をご紹介します。

今回はCTR(母比率)の信頼区間を求めていきます。

CTRの列ヘッダメニューから数値関数を使うを選び、calc_confint_ratioを選択します。

計算を作成のダイアログが表示され、中には母比率(割合)の信頼区間を求めることができるcalc_confint_ratio関数が入力されています。

もし母平均(平均値)の信頼区間を求めたい場合は、calc_confint_mean関数を使うことで求めることができます。

このcalc_confint_ratioの引数は下記になります。

calc_confint_ratio(<割合がある列名>, <サンプルサイズがある列名>,  level=0.95)

levelに信頼区間の水準を設定することができますが、記載がない場合はデフォルトの95%信頼区間となります。

今回は、下記のように計算エディタに入力します。

calc_confint_ratio(CTR, Impressions)

新しく列を作成にチェックをして、任意の列名を入力して実行します。

信頼区間の値が求められました。

ここから、信頼区間の上限、下限(範囲)を計算していきます。

CTRの列ヘッダメニューから計算を作成を選択します。

信頼区間の下限を求めるため、CTRから先ほど求めた信頼区間の値を引きます。

CTR - CI

信頼区間の下限が求まりました。

同様に計算を作成を使い、信頼区間の上限を求めますが、ここではCTRに信頼区間の値を足します。

CTR + CI

信頼区間の上限と下限を求めることができました。

チャートで信頼区間を可視化して比べていきます。

散布図(集計なし)を選択します。次に、X軸には比較したいカテゴリーを選び、Y軸にはCTRを選択します。

Y軸のメニューから範囲を選択します。

範囲のタイプにカスタムを選び、上限に信頼区間の上限を、下限に信頼区間の下限を選択します。

集計データから信頼区間を求めて可視化することができました。

もし、パーセントで表記したい場合は、プロパティからY軸の数値のフォーマットをパーセントに変更してください。

完成すると下記のチャートのようになります。