例えば、以下はNetflixのような動画配信サービスのデータで1行が1人のトライアルユーザーを表し、実際のコンバートしたかどうかや、そのユーザーの属性情報や、コンテンツの視聴時間の情報を列に持つようなデータです。
このデータには、「利用デバイス」や「性別」といった情報があり、例えば、「男性のPCユーザー」、「男性のMobileユーザー」「女性のPCユーザー」「女性のMobileユーザー」といったセグメントごとに顧客のコンバージョンを予測するモデルを作成したかったとします。
そのようなときには、以下の手順で対応が可能です。
今回は、「性別」と「利用デバイス」を組み合わせたカテゴリー列を作成したいので、両者の列をつなげて複数のカテゴリーを組み合わせたカテゴリーの列を作成します。
性別と利用デバイスの列を選択して、列ヘッダーメニューから「複数の列をつなげる(Unite)」を選択します。
複数の列をつなげる(Unite)のダイアログが表示されたら、そのまま実行します。
すると、両者を掛け合わせたカテゴリー列が作成されます。
次にこの、新しいカテゴリー列を使って、「性別と利用デバイス」ごとに予測モデルを作成します。
アナリティクス・ビューに移動して任意の予測モデルを選択して、目的変数、予測変数をそれぞれ選択します。
最後に「繰り返し」に、先程作成した「性別」「利用デバイス」掛け合わせたカテゴリー列を選択し実行します。
これで、「性別」「利用デバイス」掛け合わせたカテゴリーごとに予測モデルを構築され、例えば、サマリタブに移動するとそれぞれのモデルの予測精度の確認が可能です。