ExploratoryのAIプロンプト機能を活用し、数値列を複数のカテゴリーに分割する方法についてご紹介します。
例えば、顧客データをRFM(Recency, Frequency, Monetary)スコアに基づいて分析する際、数値として算出されたRFMスコアをカテゴリーに分類することで、顧客セグメンテーションをより明確に行うことが可能になります。
また、カテゴリー分けの手法として、「等幅」と「等頻度」での分割をExploratoryのAIプロンプトを用いて実行する具体的な手順を紹介します。
RFMスコアなどの数値データは、そのままでは顧客の特性を直感的に把握しにくい場合があります。例えば、Recency(最終購入からの経過日数)が高い顧客と低い顧客、Frequency(購入頻度)が高い顧客と低い顧客を明確に区別するためのフラグが存在しないため、顧客のセグメンテーションができていないということがあります。
この課題を解決するためには、数値データをいくつかのカテゴリーに分類し、顧客グループを識別する仕組みを構築する必要があります。
今回使用するデータは、1行が1顧客に対応し、RFMスコアが付与されている形式です。このRFMスコアは、AIプロンプトを使用して注文データから簡単に生成できます。詳しくはこちらをご覧下さい。
次に、数値として算出されたRecency、Frequency、Monetaryの各スコアをカテゴリーに分けていきます。
Recencyの数値列を等幅で5つのカテゴリーに分割する手順を説明します。
まず、Exploratoryのデータフレーム上で「AIデータ加工」ボタンをクリックします。
次に、表示されるダイアログで、Recencyの列を対象に以下のプロンプトを入力します。
Recencyの列を等幅で5つに分けて
このプロンプトを実行すると、Recencyの数値列が等しい間隔で5つのカテゴリーに分割するためのRコマンドが出力されます。
これにより、Recency列を等幅で5つのカテゴリーに分割できました。
次に、Recencyの数値列を等頻度で5つのカテゴリーに分割していきましょう。
先ほどと同様に、「AIデータ加工」ボタンをクリックし、今回は以下のプロンプトを入力します。
Recencyの列を等頻度で5つに分けて
このプロンプトを実行すると、各カテゴリーに含まれる行数がほぼ等しくなるようにRecencyの数値列が分割するためのRコマンドが出力されます。
これにより、Recency列を等幅で5つのカテゴリーに分割できました。
最後に、Recencyだけでなく、FrequencyとMonetaryの列も同時に等頻度で5つのカテゴリーに分割する手順を説明します。
「AIデータ加工」ボタンをクリックし、以下のプロンプトを入力します。
Recency、Frequency、Monetaryの列を等頻度で5つに分けて
このプロンプトを実行すると、Recency、Frequency、Monetaryの各列に対して、それぞれを等頻度で5つのカテゴリー分割するためのRコマンドが出力されます。
これにより、各RFMスコアの右側に「カテゴリー」という新しい列が作成され、カテゴリーに分割された結果が確認できます。