EDA Salon 2019年8月のまとめ

先月は、世界の家畜生産量をもとに探索的にデータ分析をしてもらいました。

EDASalon発表会

9月11日に、8月のEDA Salonの発表会を行いました。

この発表会では、EDA Salonに投稿してくれた方がスピーカーとなって、テーマ設定の背景やどういった分析をしたのかを発表していただいています。

ハイライト

EDA Salonで投稿していただいたインサイトを、もっとも印象的だったベストチャートとともに、ハイライトとして紹介していきます!

それではみていきましょう!

家畜の生産量と人口推移の関係

Wasabiさんは、家畜の生産量と人口の関係について探索的にデータ分析されています。

  • WasabiさんのTwitter @A_KI_h2
  • 家畜の生産量と人口推移の関係 - リンク

Wasabiさんの分析は最初の問題設定がはっきりしているので、その後の分析に関するストーリーもわかりやすいものでした。

問題設定は、家畜生産量と人口の間に正の相関が強い国、逆に負の相関が強い国があるのではないか、ということでした。

この答えを探し出すために、線形回帰のモデルをMutate(計算の作成)のステップの中で作り、そこから回帰係数を国ごとに出すあたりがかなり上級の技ですが、さすがWasabiさんといったかんじです。

こうしてわかった情報を元に、実際にいくつかの国をピックアップして、家畜生産量と人口の間の相関関係をラインチャートでわかりやすく可視化されてたいのが、見てる方にはわかりやすかったです。

モンゴルのヤギと羊はなぜ増えた

Tanabeさんは、既存のデータに、GDPや人口、気温などといった外部データを組み合わて、モンゴルのヤギや羊の生産量の増減に何が関係しているのかを分析されていて、おもしろい問題設定でした。

以下のような可視化をもとに相関関係を探っていましたが、どうも気温が生産量に影響しているのではないかとの仮説を提案されてました。

確かに2000年以降は、平均気温が低くなったタイミングで生産量も減少し、逆に平均気温が高くなったタイミングで、生産量も上昇しているように見えます。

モンゴルは放牧が主流とのことで、気温の影響を直接受けるために、生産量と気温に関係があるのかもしれません。

気温のデータなどを掛け合わせることによって、思いもよらぬ発見があるので、様々なデータを取得してきて一緒に可視化してみるのはグッドです!

家畜生産量と割合の経年変化 (10位まで)

Takahashiさんは、家畜の生産量が多い10ヶ国を対象に、家畜の種類ごとに生産量の推移を可視化しています。

  • TakahashiさんTwitter @HTakahahi
  • 家畜生産量と割合の経年変化 (10位まで) - リンク

下記は、家畜の種類ごとに生産量の推移を表したチャートです。

Rodentsはげっ歯類のことなんですが、ペルーがこのゲッパ類の生産量が多いようです。なぜ家畜生産量のデータにゲッパ類のデータがあるのか気になるところですが、調べてみたところペルーではネズミ科のクイという動物を食べるようです…

チャートから、それぞれの国の文化がわかるのが面白いですね。

そして、ラインチャートは、国同士で生産量を比較するだけでなくそれぞれの国のトレンドを見ることができるのも大きな魅力です。

家畜別の人口あたりの生産量比 (羊と山羊をハイライト)

続いて、Ikuya Murasatoによる投稿です!

  • Murasato IkuyaのTwitter @Ikuyamm
  • 家畜の生産において独自性が強い国はあるのか?リンク

下記は、人口一人当たりに対する家畜生産量をバーチャートで表したもので、羊と山羊をハイライトしています。

このチャートを見ると、Bruneiの一人当たりの生産量が90頭近くあるのも驚きですが、モンゴルをみてください!一人あたりの羊と山羊の生産量が合計で約28頭です!

他国に比べても、羊と山羊に特化したモンゴルは特徴的ですね。

一人当たりの生産量をバーチャートで可視化するのは面白いと思いました!尚且つ、ハイライトを使うことでモンゴルの羊と山羊のデータを強調することができるので、誰かに伝える時に役立つチャートの使い方です!

養鶏が盛んなボリビアの生産量の成長率

続いて、Hide Kojimaによる投稿です!

下記は、ラインチャートを使って養鶏の成長率を見ています。

ボリビアが1987年あたりから養鶏の生産量が急成長していて、2017年では1961年に比べて約4000%も生産量が増えています。

2016年にビルゲイツが貧困撲滅に向けて鳥の寄付を発表しましたが、ボリビアは申し出を拒否していたようです。

このチャートでのポイントは、表計算の「差の割合」を使って1961年からの成長率を可視化しているのと、ハイライトを使って特徴的な国を強調している点です。

他にもチャートを投稿しているので見てみてください。

日本の家畜生産量と人口の推移

最後に、Kan Nishidaによる投稿です!

日本の家畜生産量と人口の推移をラインチャートで可視化しています。

牛、鳥、豚は人口との相関が強いように見えますが、90年代から牛の生産量が少なくなっています。

実は、1991年から牛肉自由化が始まったため、その影響かもしれません。

可視化するだけでも、特徴的なインサイトを深掘りすることで裏にある社会情勢などが読み取ることができますね。

総評

今回は、世界の家畜生産量のデータをもとにEDA Salonに挑戦してもらいました。

データの性質上、ラインチャートを使った生産量のトレンドの可視化がメインとなりましたが、今回のEDA Salonにて様々な発見がありました。

例えば、外部データ(GDPや人口、気温など)を使って家畜生産量との関係性を見たり、国ごとに生産量を比較することで、その国の家畜生産の特色を理解することができました。

特に家畜の生産の種類に関しては、宗教や文化、土地柄などによって国ごとに違いがあって面白いインサイトがたくさんあったかと思います。

挑戦してくださった皆様ありがとうございました!

次回9月のお題決定!

次回のEDA Salonのお題が決まりました!

次回のEDASalonのお題は、「自転車のレンタルデータ」です!

photo by pixabay

自転車の貸し出し件数には、気温や天気、時間の影響はあるのかなどご自身の興味に合わせて探索的に分析してみてください!

EDA Salonへの参加方法

Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!

EDA Salonへの参加方法の詳細は下記をご覧ください。

Exploratoryをまだ持っていない方

Exploratoryをまだお持ちでない方は、30日間の無料トライアルがありますので、この機会にサインアップしてぜひ試してみてください。

みなさんのご参加お待ちしております!