皆さんは、太平洋戦争の時に、米国にいた日系人がどのような扱いを受けたのか知っていますか?
反日感情の高まった世論の中、約12万人の日系人が、internment campと呼ばれる強制収容所に収容されていたのです。
こちらのサイトでは、収容所生活の経験者の方々から提供されたデータがまとめられています。118900人のデータがありますので、収容生活を生き残ったほとんどの収容者の方々の記録がここでカバーされているということになります。
今回は、こちらのデータをダウンロードして、データを通してアメリカにおける日系人の強制収容の実態を探ってみたいと思います。
収容所の場所を見てみましょう
Camp Count
収容所があった地域がどのような場所だったか、気候データから見てみましょう
もともといた場所は、Los Angelesが多かったことが、このグラフからわかりますう。
Selected box plot
以下は、キャンプ場の年間気温の変化をヒートマップにしたものです。
真ん中にあるLos Angelesは、全体的に淡いオレンジになっていて、年中比較的温暖な気候になっていることがわかります。
これを見ると、40歳くらいを境目に、2世の方が多くなっていることがわかります。
1世の人たちの殆どは、35歳以上であり、2世の人たちの殆どは、35歳未満であることから、この溝が発生しているようです。
さて、2世の人たちの殆どが35歳未満であることは、おそらく35年前くらいから移住する人があらわれ、そこから子供が生まれ始めたということで説明がつきそうですが、なぜ、1世の人たちの殆どが35歳以上なのでしょうか?35歳くらいにならないと、移住のチャンスを得にくかったなども考えられますが、なぜ35才未満の人数がほぼゼロに近いのかは、私達の調べた範囲ではよく分かりませんでした。
もともとどこに住んでいたのかという情報も、original_address
という列にあるので、そのあたりも覗いてみましょう。
original_address
にある文字列を、google map apiで緯度、経度に直したものをマッピングすると、以下のようになります。
ヒートマップ
日本からの移民は、どこに多く住んでいたのでしょうか
日本生まれの人達のデータは、w_birthplace
が
のデータになります。
そのデータと、どの州に住んでいたかという情報をバーチャートで表示すると、以下のようになります。
これらのそれぞれの地域から、アメリカのどこに移住していたのか、可視化してみます。
では、どのキャンプに送られるかというのは、どのようにして決められたのでしょうか。直感的に考えると、単純に住んでいるところに近いキャンプに送られるのが自然だと考えられます。本当にそうなのでしょうか。
このマップからは、どうも近くに送られているというわけでは無いように見えます。では、どのようにして送られるキャンプが決められていたのでしょうか?
他のどんな変数によってある変数が決まっているかというのは、変数重要度という指標によってわかります。分析タブの、変数重要度という分析タイプを選んでください。
そこで、予測対象の列
をm_camp
にし、何か関わっていそうな列を、重要度を調べる列
で選択します
として、実行します。すると以下のような結果が出ます。
どうも、w_assemblycenter
によって、m_camp
がどこになるのか決まっているといえるようです。この、w_assemblycenter
というのが何なのか、webで少し調べてみると、このような記述が出てきます。
出典:http://www.jomm.jp/newsletter/tayori15_02.html
ここから、最初に入れられた、一時的な収容所によって、大体どこに行くことになるか決まっていたであろうことがわかります。
assembly center feature importanceなので、大体において、county -> assembly center -> camp という流れでどこに行くことになったのか決まっていったと考えられます。
assembly centerとcampがどこにあったのかというのをmapに表示させると、以下のようになります。
high f score county -> assembly center map
low f score county -> assembly center map
county -> assembly center map
どのアッセンブリーセンターから、収容所に来てるかというのをmapで表示すると、このようになります。
各地から、アッセンブリーセンターに集まり、そこからキャンプ地にどう移動したか示すマップがこちらになります