EDA Salon 第7回 - オリンピックデータ

2020年は東京オリンピックがあるということで、今年最初のEDASalonはオリンピックのデータです。

データ

データはこちらからダウンロードしてください。

もしくは、データカタログを使って簡単にインポートすることができます。

このデータはKaggleで公開されているオリンピックの過去120年分(1896~2016)のデータです。

それぞれの列の説明はMetadataにある、「Data Dictionary」から見ることができます!

サンプルの質問

データを探索的に分析するにあたって、最初に設定する質問は自分が興味のある質問を設定してみてください。

もし、どういった質問をすればいいのかわからない場合は、以下の質問を参考にしてみてください。

  • 国ごとに強いスポーツの特徴はあるか?
  • どの国が受賞数を伸ばしているか?または減っているか?
  • スポーツごとに年齢や身長、体重がどう影響しているか?

EDA Salonへの参加方法

Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!

EDA Salonへの参加方法の詳細は下記をご覧ください。

Exploratoryをまだ持っていない方

Exploratoryをまだお持ちでない方は、フルバージョンを30日間の無料トライアルで試すか、パブリックバージョン(Exploratory Public)を無料で使うことができるのでぜひサインアップしてみてください。