
ExploratoryのAI 関数を活用することで、企業名から業界名を自動的に生成し、データに列として追加する方法を紹介します。この機能により、アンケートデータや顧客リストなど、企業名が含まれる多様なデータセットにおいて、手作業での分類にかかる時間と労力を大幅に削減し、分析の効率を向上させることが可能になります。
企業名データから手動で業界名を分類する作業は、時間と労力がかかるだけでなく、分類の一貫性を保つことが難しいという課題があります。特に、大量の企業データを取り扱う場合や、複数の担当者が分類を行う場合には、データの品質にばらつきが生じるリスクが高まります。
今回使用するデータは、日本およびアメリカの一部の企業名を含むデータセットです。このデータセットには「企業名」という列があり、ここから各企業の業界情報を抽出して新しい列として追加します。

企業名の列ヘッダーメニューから「AI関数を作成」を選択します。
今回は、以下のシンプルなプロンプトを使用します。
提供された会社名から、その会社の業種の情報を生成をしてください。

プロンプトを入力後、実行することで、AIが生成した業種名が新しい列としてデータフレームに追加されます。

生成された業種名は、例えば「全日本空輸株式会社」に対して「航空運送」といった形で、直感的で適切な結果が返されることを確認できます。これにより、手動での分類作業を大幅に削減し、データの品質を向上させることが可能になります。
より正確な産業分類が必要な場合は、日本の標準産業分類などの公開されている分類体系に基づいたプロンプトを使用することができます。この方法は、特定の業界基準に沿った厳密な分類を行いたい場合に特に有効です。
日本の政府が公開している標準産業分類を基にしたプロンプトを使用します。
このテンプレートには、以下のプロンプトが記述されています。
提供された会社名から、その会社の産業の情報を生成してください。
その際に、以下の日本標準産業分類の産業名を元に結果を返してください。
- 第1次産業
農業,林業
漁業
- 第2次産業
鉱業,採石業,砂利採取業
建設業
製造業
- 第3次産業
電気・ガス・熱供給・水道業
情報通信業
運輸業,郵便業
卸売業,小売業
金融業,保険業
不動産業,物品賃貸業
学術研究,専門・技術サービス業
宿泊業,飲食サービス業
生活関連サービス業,娯楽業
教育,学習支援業
医療,福祉
複合サービス事業
サービス業(他に分類されないもの)
公務(他に分類されるものを除く)
分類不能の産業

このプロンプトには、第一次産業、第二次産業、第三次産業といった具体的な産業分類のラベルが定義されており、AIはこれらの定義に基づいて産業名を生成します。
企業名に基づいて「産業名」列がデータフレームに追加されます。一部の企業では、複数の産業にまたがる場合があり、その際にはカンマ区切りで複数の産業名が返されることがあります。

これにより、各企業がどの産業に属しているかをより正確に判断し、詳細な分析を行うことが可能になります。