アナリティクスの「予測」タブの予測値の計算方法

線形回帰、ロジスティック回帰、ランダムフォレスト、XGBootなどの「教師あり」の予測のモデルの予測タブでは、実測値をもとにした値がグレーで可視化され、予測結果がブルーで可視化されています。

このチャートはPartial Dependence Plot(PDP)と呼ばれるもので、注目している変数の値を変化させたときに、予測結果がどう変わるかを可視化したチャートとなります。

具体的な計算方法として、数値型の予測変数の場合は、注目している変数以外の値は元のデータのままにし、注目変数の値だけを段階的に変化させて予測を行い、その予測結果の平均を可視化します。

例えば上記のチャートでは、「職位」以外の値はすべて元のデータのままにし、各行の「職位」の値を変化させて予測を行い、その結果を平均化することで、職位ごとの給料の予測値の違いを可視化しています。

カテゴリー型の予測変数に対しても同様の考え方で、全ての行の該当変数を、それぞれのカテゴリーに置き換えて予測を行い、その予測値の平均を計算・可視化しています。

例えば上記の「職種」では、「職種」以外の値は元のデータを使いながら、全ての行の「職種」の値をそれぞれ「マネージャー」「人事」「製造ディレクター」などに固定して予測し、その平均値を出しています。これにより、各職種が給料の予測結果に与える影響を比較することができます。

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio