EDA Salon 第9回 - コロナウイルスのデータ

3月、4月は、新型コロナウイルス(COVID-19)のデータを使用します。

皆様の力を最大限に活かして、正しい状況の把握や役に立つ情報を世界に発信していきましょう。

下記に、国内のデータと世界のデータでオススメのデータを紹介します。

日本国内のコロナウイルスのデータby COVID19Japan.com

Google Spread sheetで公開されていますが、一部の人しか権限がないため、Googleアカウントとデータが紐づけられないようです。

そのため、Webスクレイピングしたものをスケジュールして公開しているので、下記からインポートしてみてください。

世界のコロナウイルスのデータ by JHUCSSE

Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)が公開している世界のコロナウイルスのデータです。最も多くの人に使用されているデータで、世界のコロナウイルスのデータを使用したいならまずはJHUのデータをダウンロードしてみてください。

コロナウイルスのデータ一覧

他にもコロナウイルスに関するデータを国内・国外問わずまとめて公開しています。

興味のある方は是非試してみてください。

既に投稿されたインサイト

時系列データを比較してみた。by Wasabiさん

ノートの詳細はこちらから

コロナウイルスのデータを用いて、時系列データの類似度合いを可視化されています。いくつかのアルゴリズムでそれらの類似度合いを算出して検証されていて、非常に面白いので是非ご覧になってください。

日本における新型コロナウイルスへの感染状況について by Edamotoさん

ノートの詳細はこちらから

都道府県ごとのコロナウイルスの感染者数と昼間人口や面積などを用いて、K-meansクラスタリングをして分類されています。外部データを用いることで、新たな視点から分析することができますね!非常に面白い投稿ですので、是非こちらもご覧になってください。

EDA Salonへの参加方法

Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!

EDA Salonへの参加方法の詳細は下記をご覧ください。

Exploratoryをまだ持っていない方

Exploratoryをまだお持ちでない方は、フルバージョンを30日間の無料トライアルで試すか、パブリックバージョン(Exploratory Public)を無料で使うことができるのでぜひサインアップしてみてください。