共起ネットワークを作成する方法

こちらのノートでは、アナリティクス・ビューの「テキスト分析」から共起ネットワークを作成する方法を紹介します。

利用データ

今回は1行1回答になっている、とあるセミナーの自由記述のアンケートデータを利用します。

共起ネットワークを作成する

アナリティクスビューに移動して、タイプに「テキスト分析」、テキストの列に自由記述の回答列を選択し、実行します。

すると、テキスト分析の実行結果が表示されるので、「単語ペア・ネットワーク」タブを選択します。

共起ネットワークが表示されました。

各サークルのサイズは単語のカウント数に応じてを大きくなり、単語間を結ぶ線の太さが、それぞれの単語が1つのドキュメント(1つの回答)の中でどれだけ多く一緒に利用されているかを表しています。

従って、このアンケートの回答者の多くの方が、「もっと事例の紹介が欲しい」と考えていると想定できるわけです。

共起ネットワークに利用される単語を調整する

またもう少し、細かく見てみると、この共起ネットワークでは、本来、「データ解析」のように1つの単語として扱われて欲しい単語が、「データ」、「解析」と2つの単語に分かれていることが分かります。

また例えば、「思う」のように、共起ネットワークで可視化しても、あまりに役に立たないような単語は「ストップワード」として扱い、可視化の対象から除くことで、より直感的に結果の解釈がしやすくなります。

そういったときには、プロパティからストップワードを追加したり、一つの単語として扱う単語を指定できます。

例えば、プロパティからは、以下を指定できます。

  • ストップワードを取り除くかどうか
  • ストップワードの言語

また今回は、ストップワードに「思う」を追加して、「データ」、「解析」と2つに分かれている単語を1つの単語として扱いたいので、「追加するストップワード」、「一つの単語として扱う単語」に必要な情報を入力します。

もし複数の単語を追加したければ、,(カンマ)で区切って複数の単語を入力できます。

他に以下の項目も指定できます。

  • 区切り文字を取り除くかどうか
  • 数字を取り除くかどうか
  • ひらがなのみの単語を取り除くかどうか

「単語ペア-ネットワーク」からは、その他の共起ネットワークに関する設定の変更が可能です。

設定が完了したら、適用します。

2つに分かれていた「データ」と「解析」を1つの単語にまとめることができ、さらに、「思う」という単語をストップワードに追加することで、不要な単語を共起ネットワークから取り除くことができました。