K-Meansクラスタリングを実行した時に、「箱ヒゲ図」のタブから各クラスターの特徴を理解していくことができます。
箱ヒゲ図自体の見方についてはこちらのノートをご覧ください。
しかし、K-Meansの実行結果によっては、箱ヒゲ図の箱やヒゲが上手く描画されないケースがあります。
例えば、下記の箱ヒゲ図では最小値や最大値の「ヒゲ」が表示されていません。
「中央値」が表示されない箱ヒゲ図も存在しています。
さらに「箱自体」が表示されない箱ヒゲ図もあったりします。
これらの箱ヒゲ図が上手く描画できない理由として「データの中に偏りがある」のが原因となることが多いです。
このノートでは、箱ヒゲ図が上手く描画できないケースを3つ紹介いたします。
サンプルデータは従業員向けのアンケートデータで、K-meansクラスタリングで使用する変数にはアンケートの5段階評価の数値列を使用しています。
「上司のフィードバックは的確だ」といった列の箱ヒゲ図を見るとクラスター1とクラスター2で「ヒゲ」が描画されていません。
「会社のビジョンに共感できる」といった列の箱ヒゲ図を見るとクラスター1では「中央値」が描画されていません。
「上司のフィードバックは的確だ」といった列の箱ヒゲ図を見るとクラスター3では「箱」が描画されていません。