
アンケートデータにおいて、複数回答形式の質問に対する回答が1つのセルにカンマ区切りで格納されている場合、そのデータを分析に適した形式に変換する必要があります。特に、各選択肢が独立した列として展開され、回答の有無が0または1で示される形式は、選択肢間の関係性の相関分析やクラスタリングなどに有効です。
今回は、ExploratoryのAI プロンプトを利用して、複数回答のデータを各選択肢ごとの0/1形式の列に変換する手順を詳細に解説します。この方法により、UI上での複雑な複数ステップの操作を一つのプロンプトで効率的に実行することが可能になります。
アンケートの複数回答データが1つのセルにカンマ区切りで格納されている場合、各選択肢の回答数を直接集計したり、選択肢間の関係性を分析したりすることが困難です。例えば、「サービスの改善点」のような質問で「特になし, 通話品質」といった形式でデータが保存されていると、各改善点の選択肢が個別の列として存在しないため、相関分析やクラスタリングなどの高度な分析手法を適用することができません。
この形式のデータを分析に活用するためには、各選択肢を独立した列として展開し、回答があれば1、なければ0という形式に変換する前処理が必要です。しかし、この変換を手動で行う場合、選択肢の行分割、行から列への変換など、複数のステップを踏む必要があり、手間と時間がかかります。
今回使用するデータは、アンケートの回答データであり、1行が1回答者となっています。
「サービスの改善点」という列には、カンマ区切りで複数の回答が格納されています。

このデータを、各回答選択肢が独立した列となり、回答の有無が0または1で示される形式に変換します。
テーブルビューから「AI データ加工」ボタンをクリックします。表示されるプロンプト入力欄に、以下の指示を入力します。
サービスの改善点の列を分割し、その後回答値ごとに0/1の値を持った列として展開したい

このプロンプトは、「サービスの改善点」列の複数回答をまず行に分割し、次に各回答選択肢を個別の列として展開し、回答の有無を0または1で表現するようAIに指示しています。
プロンプトを実行することで、複数回答のデータを0/1形式の列に変換するためのRスクリプトが出力されています。

実行することで、「特になし」や「通話品質」といった各回答選択肢が新しい列として追加され、それぞれの列には回答があれば1、なければ0の値が格納されていることがわかります。
