
国際的なビジネスを展開していると、顧客データの中に様々な国の電話番号が含まれることがあります。電話番号には国番号が含まれていますが、入力形式が統一されていない場合、手作業や従来のルールベースの処理で国籍を特定するのは非常に困難です。
今回は、ExploratoryのAI関数を使用して、表記が混在する電話番号データから自動的に国籍を判定し、新しい列として抽出する方法を紹介します。
電話番号から国籍を判定しようとする際、データの入力形式が「+1」、「(1)」、「1-」のようにバラバラであるため、単純なパターンマッチングでは全てのデータを正確に処理することができません。
また、全ての国番号と国名の対応関係を把握して手動で変換ルールを作成するには膨大な手間がかかり、分析の効率を著しく低下させる原因となります。
今回使用するデータは、1行が1顧客の情報を表しており、各行に「電話番号」という列が存在します。この列には、国番号を含む様々な形式の電話番号が記録されています。
まず、電話番号の列から国籍を特定するためのAI関数を作成します。Exploratoryでは、プロンプトを入力するだけでAIがデータを解釈し、必要な情報を抽出することが可能です。
対象となる「電話番号」列のヘッダメニューから「AI関数」の「作成」を選択します。AI関数の作成画面が表示されたら、プロンプトを入力します。
プロンプトには「電話番号の情報から国籍を判定して」と入力します。新しく作成する列名を「国」と指定し、実行ボタンをクリックします。
この操作により、AIが電話番号に含まれる国番号(例:1はアメリカ、81は日本、44はイギリスなど)を自動的に判別します。入力形式が不統一であっても、AIが文脈を理解して正確な国名を返します。
AI関数を活用することで、複雑な正規表現や膨大な変換マスタを用意することなく、非構造的なデータから価値のある情報を素早く抽出できるようになります。今回の国籍判定以外にも、名前の表記揺れの修正など、様々なデータクリーニングに応用することが可能です。