データの出典・引用元 1.陽性数、退院数、死亡数など ・ 陽性数及びその地域別・年代別の内訳は「都道府県別新型コロナウイルス感染者数マップ(ジャッグジャパン株式会社提供)」 でCC BY-NCで提供されているcsvデータから。同データの前提・留意事項・免責事項等は同社によるredam記載のとおり。データは同社による事案の覚知に伴い更新されていることことから、下記厚労省サイト掲載の数字(毎日正午時点の報告数集計)とは異なる。 ・ ただし、速報性等の観点から、上記データと以下の自治体や各地のエンジニア有志・団体等のデータを都道府県別に比較し、累積陽性者数が多い方を採用した。そのコードについては COVIDのデータ取得に用いているRスクリプトを参照。また、この中で比較対象とした各地域のデータは、自治体開設のサイト又はCC-BY等ライセンス表記のある民間サイトで以下のもの。 北海道オープンデータポータル / 青森県オープンデータカタログ / 秋田県新型コロナウイルス感染者関連の情報について / 宮城県新型コロナウイルス感染症対策サイト県内の発生状況 / 山形県新型コロナウイルス感染症対策サイト(非公式) / 福島県【新型コロナ】オープンデータ / 栃木県における新型コロナウイルス感染症の発生状況及び検査状況について / 茨城県新型コロナウイルス感染症陽性者一覧 / 群馬県新型コロナウイルス感染症患者の発生状況 / 【埼玉県】新型コロナウイルス感染症の発生状況 / 千葉県新型コロナウイルス感染症対策「患者の発生状況について」 / 東京都新型コロナウイルス感染症対策サイト / 神奈川県新型コロナウイルス感染症対策 陽性患者数及び陽性患者の属性データ / 新潟県新型コロナウイルス感染症県内の発生状況 / 長野県における新型コロナウイルス感染症の動向 / 山梨県新型コロナウイルス感染症対策サイトGI-Hubレポジトリ / 富山県新型コロナウイルス感染症の県内の患者等発生状況 / 石川県新型コロナウイルス感染症の県内の発生状況 / 福井県新型コロナウイルス感染症オープンデータ / ふじのくにデータカタログ新型コロナウイルス感染症県内動向 / 愛知県新型コロナウイルス感染症県内の感染者・遺伝子検査件数 / 岐阜県オープンデータカタログサイト / 三重県新型コロナウイルス感染症の発生状況 / 京都府新型コロナウイルス感染症に関連する情報 / 大阪府新型コロナウイルス感染症対策サイトGit-Hubレポジトリ / 奈良県_新型コロナウイルス感染症について / 兵庫県新型コロナウイルスに感染した患者の状況 / 鳥取県新型コロナウイルス感染症対策特設サイト / 島根県新型コロナウイルス感染症患者の概要について / おかやまオープンデータカタログ / 山口県オープンデータカタログ陽性患者属性 / 徳島県 新型コロナウイルス感染症について / 香川県新型コロナウイルス感染症に関する情報 / 愛媛県オープンデータカタログ / 高知県新型コロナウイルス感染症関連オープンデータ / 福岡県新型コロナウイルス感染症陽性患者発表情報 / 佐賀県新型コロナウイルス感染症対策サイト / 長崎県新型コロナウイルス感染症陽性患者発表情報 / 熊本県新型コロナウイルス感染症対策サイトGit-Hubレポジトリ / 大分県オープンデータカタログサイト / 宮崎県新型コロナウイルス感染症患者の発生状況 / 鹿児島県新型コロナウイルス感染症に関する情報 / 沖縄県新型コロナウイルス感染症対策サイト ・ 上記双方を集約したデータは COVID19国内版ローデータに掲載。確定日、年代、性別、受診都道府県、居住都道府県の一覧。なお、居住都道府県については元データの表記の揺れが大きいため、あくまで参考程度。 ・ 死者数、退院数、無症状者数及び重症者数(人工呼吸器装着又はICU入院者)は厚生労働省新型コロナウイルス対策サイトの国内での発生状況から。これらは各日正午時点の報告集計数であり、同省公表前は前日の計数を暫定的に用いているため、上記の陽性者数とは厳密にはタイムラグがあるため留意。 ・ 死者数、退院者数について4月22日分から、陽性者名簿との未突合分を含む公表値となった。うち前者については21日以前のデータがあるため数字の連続性が保てるものの、後者(退院数)については21日以前の未突合分を含む数字が公表されていないため、数字の断絶が生じていることに留意。 ・ 上記集計中、「都道府県別」は受診地ベースの集計。ただし、ジャッグジャパン社データで受診都道府県が「長崎県」とされているクルーズ船関係は長崎県とは別カテゴリとし、データ上は「長崎客船」、また上記集計項目上は「空港及び客船」等として扱っている。 ・ 時系列のグラフでは、感染者数等は3月以降、人の移動に伴うものはその2週間前の2月15日以降を表示しているが、累計値は事態発生以降の集計値。 2.陽性者数が2倍になる日数(倍加時間)やSIRモデルによる流行予測についてのデータ加工 ・ 感染者数や死者数が2倍になるのに要する日数は、t日の累計感染者数(死者数)をxtとすると、log((xt/xt-7)(1/7))2(7日間についての1日平均伸び率を底とした2の対数)による。なお、世界版とは異なって当日の陽性者数は随時、更新されるため、この国内版では8日前から前日までの平均伸び率を用いた。 ・ 経過日数と累積感染者・死者数の対数グラフのリファレンスライン(○日で2倍)は、初期値(20人)×2(経過日数/○日)による。また、これらのチャートに用いている、ダウンロード後のEDFファイルに含まれていないカスタムスクリプトについてはこちらに掲載。 ・ 流行予測のチャートは、直近、1週間前、2週間前のそれぞれの時点における感染者数の伸び率からSIRモデルをベースに試算。詳しくは、この部分で用いているSIRforecastのカスタムスクリプトを参照(うち、感染率及び回復率はデフォルトでは過去2週間の平均だが、ここでは3週間とっている)。なお、SIRモデルはシンプルなパンデミックの予測モデルであり、市中における感染者の均一な分布等を暗黙の前提としているが、ここでは感染源や感染実態等の統一的なデータがないため、これらを問わず、陽性者数の推移から単純に算出したもの。純理論的な分、現実を捨象しすぎるキライも否めず、例えばしばしばあるのがコミュニティ起因の局所的なクラスターだが、それを記述するにはもっと細かに「分断」されたモデルの集計値を用いるなどの工夫が必要であるものの、このモデルはそうした対象集団内の物理的・社会的な「分断」や「境界」の類を考慮しておらず、結果、しばしば過大なシミュレーションとなりがち。なので、「絶対数」にはさして意味がなく、「推移」や「時期」といった面での目途程度で受け止めるべきもの。 3.散布図に用いている社会経済統計など ・ 人口密度、人口集中地区居住割合、通勤・通学手段、世帯人員、高齢化率、15~39歳人口及び共稼ぎ世帯割合は、総務省「国勢調査」から。原則として平成27年、ただし、通勤・通学手段は10年おきの調査のため、平成22年。 ・ 小売・飲食・娯楽業従事割合は、総務省「経済センサス活動調査」から。 ・ 転職率は、総務省「就業構造基本調査」から。 4.その他のデータ ・ LINE調査による相談件数は、4月10日の厚労省プレスリリースから。 ・ 人流データはAppleによるMobiliry Trend ReportとGoogleのCommunity Mobility Report、Yahooの全国主要都市来訪者・往訪者推移指数から。 参考 世界各国の状況については、例えばジョンズ・ホプキンス大学提供のダッシュボードや、 このダッシュボードの世界版を参照。