特定の日付列の値が、開始日と終了日の範囲内に収まっているかを判定し、その結果に基づいてフラグを立てたいとします。
例えば、商品の「お届け予定日」が「出荷日」から「配送完了日」の期間内に適切に収まっているかどうかを判定したいです。
Exploratoryでは、UIの機能である「条件を元に計算」とAIを使ったデータの加工である「AIプロンプト」を使い、特定の日付が指定された期間内にあるかを判定してフラグを作ることが可能です。
データ分析において、特定の日付が二つの日付(開始日と終了日)で定義される期間内に含まれるかどうかを正確に判定する必要がある場合があります。
このセクションでは、ExploratoryのUIを活用して、お届け予定日が配送期間内に収まっているかを判定しする手順を説明します。
今回使用するデータは、ECサイトの注文データです。このデータは1行が1注文に対応しており、顧客ID、注文日、お届け予定日、出荷日、配送日などの列が含まれています。
お届け予定日が「出荷日」と「配送日」の間に収まっているかを判定するフラグを作成します。
「お届け予定日」列のヘッダーメニューから「値を置き換える(条件を指定)」を選択します。
これにより、「条件を元に計算」のダイアログが表示されます。
表示されたダイアログで、条件のプラスボタンをクリックし、演算子には「範囲内」を選択します。次に、値の入力方法を「列」に切り替えます。開始日には「出荷日」列を、終了日には「配送日」列を指定します。
これにより、「お届け予定日」が「出荷日」と「配送日」の間に収まっているかどうかの条件が設定されます。
次に、新しい値の指定を行います。今回は、論理値を使用して遅延フラグを作成します。お届け予定日が範囲内に収まっている場合は「FALSE」(遅延なし)、範囲外にある場合は「TRUE」(遅延あり)と設定します。
新しい列の名前は「遅延フラグ」と指定し、「実行」ボタンをクリックします。
これにより、お届け予定日が配送期間内に収まっていれば「FALSE」、収まっていなければ「TRUE」を返す遅延フラグの列を作ることができました。
このセクションでは、ExploratoryのAIプロンプト機能を利用して、同様の遅延フラグを作成する手順を説明します。AIプロンプトは、自然言語で指示を記述することで、Rコマンドを自動生成し、データ加工を実行できる強力な機能です。
Exploratoryの「AIデータ加工」機能を選択します。
AIプロンプトの入力欄に、以下のプロンプトを指示します。
お届け予定日が出荷日と配送日の間に収まらない、遅延している場合はTRUEを返して
AIプロンプトが生成したRコマンドを確認し、「ステップとして実行」ボタンをクリックします。
AIプロンプトは、指示内容に基づいてRコマンドを生成します。
この実行により、「遅延フラグ」列がデータフレームに追加され、UIを使用した方法と同様に、お届け予定日が配送期間外にある場合に「TRUE」が返されています。