Exploratory アワー #727 - AI 関数: 企業名の表記揺れを簡単に修正する

概要

アンケートデータや顧客情報などにおいて、企業名の表記揺れはデータの品質を低下させ、分析の妨げとなることがあります。例えば、「トヨタ自動車」が「トヨタ自動車株式会社」や「TOYOTA」のように表記されたり、「株式会社」が前後に付いたり付かなかったりするケースが頻繁に発生します。このような表記揺れは、手作業での修正が困難であり、時間と労力を要する課題です。

Exploratoryのバージョン14で追加されたAI関数を活用することで、これらの企業名の表記揺れを効率的かつ正確に統一することが可能になりました。そこで、AI関数を用いて企業名を正式な法人名称に修正する具体的な手順を解説します。

問題

企業名の表記揺れは、データ分析において深刻な問題を引き起こします。具体的には、以下のような課題が挙げられます。

解決方法

今回使用するのは表記揺れが発生している企業名のデータです。

使用するデータはこちらからダウンロードいただけます。

まず、表記揺れを修正したい列のヘッダメニューから、「AI 関数」を選択します。

これにより、AI 関数のダイアログが表示されます。このダイアログで、AIに実行させたいタスクを自然言語で記述します。

プロンプトには以下のように指定して実行します。この指示により、AIは各組織名に対して、その正式な法人名称を識別し、出力します。

各組織名について、正式な法人名称を返してください。

実行すると、AIによって出力された正式な企業名の新しい列が作成されます。

この結果を見ると、「株式会社」の有無や前株・後株の違い、さらには略称など、様々な表記揺れが統一された結果が得られていることがわかります。

AIの賢さは、単なる文字列の一致に留まりません。例えば、「ユニクロ」や「無印良品」のように、一般的に店舗名として認識されていますが、AIは正確に「株式会社ファーストリテイリング」や「株式会社良品計画」といった正しい企業名称を返します。

これは、AIが単語の表面的な情報だけでなく、その意味や文脈を理解している証拠であり、より簡単かつ高精度で表記揺れの修正が可能になります。

ビデオ

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio