3月、4月は、新型コロナウイルス(COVID-19)のデータを使用します。
皆様の力を最大限に活かして、正しい状況の把握や役に立つ情報を世界に発信していきましょう。
下記に、国内のデータと世界のデータでオススメのデータを紹介します。
Google Spread sheetで公開されていますが、一部の人しか権限がないため、Googleアカウントとデータが紐づけられないようです。
そのため、Webスクレイピングしたものをスケジュールして公開しているので、下記からインポートしてみてください。
Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)が公開している世界のコロナウイルスのデータです。最も多くの人に使用されているデータで、世界のコロナウイルスのデータを使用したいならまずはJHUのデータをダウンロードしてみてください。
ノートの詳細はこちらから
コロナウイルスのデータを用いて、時系列データの類似度合いを可視化されています。いくつかのアルゴリズムでそれらの類似度合いを算出して検証されていて、非常に面白いので是非ご覧になってください。
ノートの詳細はこちらから
都道府県ごとのコロナウイルスの感染者数と昼間人口や面積などを用いて、K-meansクラスタリングをして分類されています。外部データを用いることで、新たな視点から分析することができますね!非常に面白い投稿ですので、是非こちらもご覧になってください。
Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!
EDA Salonへの参加方法の詳細は下記をご覧ください。
Exploratoryをまだお持ちでない方は、フルバージョンを30日間の無料トライアルで試すか、パブリックバージョン(Exploratory Public)を無料で使うことができるのでぜひサインアップしてみてください。