10月のEDA Salon、ユニコーン企業のデータを探索していきます。
ユニコーン企業が多い国ってちょっとかっこいい。そして実は多くの人が知らないだけで、既に日本にも多くのユニコーン企業があるのかもしれない。
今回は世界的に見て日本はユニコーン企業の数が多いのか少ないのか、もし少ないのであれば、どうすれば増やすことができるのか。そういったことを念頭において探索をしていく。
まずは、どの国にユニコーン企業が多く存在しているのかを見ていく。
すると以下のことが分かる。
続いて、k-meansクラスタラリングを利用して、ユニコーン企業の数で国を4つのクラスターに分け、何か別の特徴が見えてこないか調べてみる。
すると上記のようにK-meansクラスタリングで以下のようなグループ分けができた。
さらに上位のクラスターに特徴がないか地図で可視化してみると、国土や人口、経済力が関係してそうな気がしてきた。
そこで国ごとにGDP、国土面積、人口が揃ったデータをデータ・カタログからインポート、元データに結合して、クラスターを新たに作成し日本がどのようなクラスターに属するかを確認して、同じクラスターの中でユニコーン企業数が多い国がないか調べていきたい。
なおGDPは人口と相関しており、また人口は国土面積と強い相関があることが以下にて確認できた。
そこで一人あたりのGDPや、人口密度といった形でスケールを揃えた変数を追加し、最終的に以下でグループ分けすることにした。
すると日本は中央に近い座標にプロットされ、クラスター3に属する形になった。
次に箱ひげ図を使ってこのクラスター3が今回の国々の中で、どのような特徴を持っているかを確認する。
すると人口あたりのGDPが高いが、他のクラスターと比べて国土は狭く、人口密度は低めといった特徴をもっているクラスターと言えることが分かった。
続いて、得られた結果をもとに、このクラスターの中でのユニコーン企業数を調べてみると、ドイツとイギリスのユニコーン企業数が多いことが分かった(各凡例は“国名_ユニコーン企業の数”)。
同じクラスターの中でも日本と距離の近く、ユニコーン企業数が多い、これらの国々の社会制度などを参考にしたら、日本でも取り入れられるユニコーン企業を増やすヒントが見つかるかもしれない。
今回の探索を通して以下のことが分かった。