下記のような集計済みのデータで信頼区間を求めて可視化する方法をご紹介します。
今回はCTR(母比率)の信頼区間を求めていきます。
CTRの列ヘッダメニューから数値関数を使うを選び、calc_confint_ratioを選択します。
計算を作成のダイアログが表示され、中には母比率(割合)の信頼区間を求めることができるcalc_confint_ratio
関数が入力されています。
もし母平均(平均値)の信頼区間を求めたい場合は、calc_confint_mean
関数を使うことで求めることができます。
このcalc_confint_ratio
の引数は下記になります。
calc_confint_ratio(<割合がある列名>, <サンプルサイズがある列名>, level=0.95)
levelに信頼区間の水準を設定することができますが、記載がない場合はデフォルトの95%信頼区間となります。
今回は、下記のように計算エディタに入力します。
calc_confint_ratio(CTR, Impressions)
新しく列を作成にチェックをして、任意の列名を入力して実行します。
信頼区間の値が求められました。
ここから、信頼区間の上限、下限(範囲)を計算していきます。
CTRの列ヘッダメニューから計算を作成を選択します。
信頼区間の下限を求めるため、CTRから先ほど求めた信頼区間の値を引きます。
CTR - CI
信頼区間の下限が求まりました。
同様に計算を作成を使い、信頼区間の上限を求めますが、ここではCTRに信頼区間の値を足します。
CTR + CI
信頼区間の上限と下限を求めることができました。
チャートで信頼区間を可視化して比べていきます。
散布図(集計なし)を選択します。次に、X軸には比較したいカテゴリーを選び、Y軸にはCTRを選択します。
Y軸のメニューから範囲を選択します。
範囲のタイプにカスタムを選び、上限に信頼区間の上限を、下限に信頼区間の下限を選択します。
集計データから信頼区間を求めて可視化することができました。
もし、パーセントで表記したい場合は、プロパティからY軸の数値のフォーマットをパーセントに変更してください。
完成すると下記のチャートのようになります。