class: center, middle, inverse background-image: url(libs/exploratory/images/p1.png) background-size: cover <!--- inverse background-color: #006600 ---> # 8月 EDA Salon --- ## テーマ設定とアプローチ - アジアの中で特徴的な傾向を持っている国に興味をもったので、**2017年のアジアの一人あたりの生産量**を軸にEDAしてみました。 - 実際に**PCA**と呼ばれる複数データ(変数)を二次元に要約することができるアナリティクスを使ってデータを探索し、アナリティクスから得られた仮説をチャートで可視化した形になります。 --- ## 結論 - **モンゴル**はパブリック・イメージ通りというか、パブリック・イメージを大幅に上回るほど**羊と山羊の人口あたりの生産量に特徴がある**ということが分かった - **イスラム教徒が多い国は豚の生産量が少ない**ということが分かった --- ## PCA(主成分分析)の結果
Loading...
--- ## 羊と山羊の一人あたりの生産量
Loading...
--- ## PCA - イスラム教徒が多い国で色分け
Loading...
--- ## 豚肉の人口あたりの生産量 .center[
Loading...
] --- ## 分析のポイント 1. 生産量を人口で割って、一人あたりの生産量という単位で揃えたこと。 2. 人口データやイスラム教徒のデータを外部データからスクレイピングして利用したこと。 3. その際はcountrycode関数を使った結合の精度をあげたこと。 --- ## フリーコメント PCAはこういった複数データ(変数)の要約に使えるので、データの特徴を見てみたいと思った際には有力なツールとなるかと思います。さらに、色にカテゴリを割り当てるとより、特徴を理解しやすくなります。詳細は明日の[無料セミナー](https://exploratory.io/online-seminar-jp)、録画を見てる人は[無料セミナーの録画](https://exploratory.io/online-seminar-jp)を見るとPCAの詳細が分かると思うので、是非ご確認ください。