アンケートデータにおける複数の属性列を効率的にクロス集計する方法について解説します。
特に、ワイド形式の属性データをロング形式に変換することで、性別、年代、職種といった多様な回答者属性とNPS(ネットプロモータースコア)のカテゴリーの関係性を一元的に分析する手順を詳細に説明します。このアプローチにより、個別の属性ごとに集計する手間を省くことができます。
アンケートデータにおいて、回答者の属性情報(例:性別、年代、職種)がそれぞれ異なる列に格納されている場合、これらの属性をまとめてクロス集計する際に以下の問題が発生します。
このセクションでは、アンケートデータの属性列をワイド形式からロング形式に変換する具体的な手順を説明します。
この変換により、複数の属性列を「属性」と「値」の2つの列に集約し、その後のクロス集計を効率化します。
まず、今回使用するデータは、1行が1回答者に対応し、性別、年代、職種、子供の有無といった回答者の属性がそれぞれ異なる列に格納されているアンケートデータです。
次に、これらの属性列をまとめて1つの「属性」列と1つの「値」列に変換します。
この変換は、ExploratoryのUIまたはAIプロンプト機能を使用して実行できます。
性別から結婚の有無までの属性列をShiftキーを押しながら複数選択し、列ヘッダーメニューから「ワイド型からロング型へ」の「選択された範囲」をクリックします。
表示されるダイアログで、新しく作成されるキー列の名前を「属性」、値の列の名前を「値」と指定し、「実行」ボタンをクリックします。
これにより、元のデータがロング形式に変換され、行数が増加しますが、属性情報が一元化されます。
このセクションでは、AIプロンプト機能を利用して属性列をロング形式に変換する手順を説明します。
AIプロンプトは、Rコマンドの知識がなくても自然言語でデータ加工の指示を出すことができるため、より直感的な操作が可能です。
AI プロンプトを使うため「AI データ加工」のボタンをクリックします。
プロンプト入力欄に「性別から子供の有無までの列をロング型に変換して」と入力して実行します。
これにより、性別から子供の有無までの列をロング型に変換するためのRコマンドが返ってきます。
これにより、性別から子供の有無までの属性列が「項目」と「値」という新しい列にまとめられたロング形式のデータに変換されます。
このセクションでは、ロング形式に変換されたデータを使用して、属性とNPSカテゴリーのクロス集計を行う手順を説明します。
チャートビューに移動し、チャートタイプとして「ピボットテーブル」を選択します。
次に、行に「項目」列と「値」列を順に割り当てます。これにより、各属性(項目)とその具体的な回答(値)が階層的に表示されます。
次に列に「NPSカテゴリー」などのクロス集計したいカテゴリー列を、値には「行の数(回答者数)」などの数値列を割り当てることで、クロス集計ができるようになります。