皆さんは、太平洋戦争の時に、米国にいた日系人がどのような扱いを受けたのか知っていますか?

反日感情の高まった世論の中、約12万人の日系人が、internment campと呼ばれる強制収容所に収容されていたのです。

こちらのサイトでは、収容所生活の経験者の方々から提供されたデータがまとめられています。118900人のデータがありますので、収容生活を生き残ったほとんどの収容者の方々の記録がここでカバーされているということになります。

今回は、こちらのデータをダウンロードして、データを通してアメリカにおける日系人の強制収容の実態を探ってみたいと思います。

データの探索

収容所の場所を見てみましょう

Camp Count

Loading…
Loading…

収容所の気候

収容所があった地域がどのような場所だったか、気候データから見てみましょう

もともといた場所は、Los Angelesが多かったことが、このグラフからわかりますう。

Loading…
キャンプ場の平均気温の推移
Loading…
All box plot
Loading…
寒いところ、暑いところとLos Angelesの気候
Loading…

Selected box plot

Loading…
Hot camps
Loading…
Cold camps
Loading…

以下は、キャンプ場の年間気温の変化をヒートマップにしたものです。

真ん中にあるLos Angelesは、全体的に淡いオレンジになっていて、年中比較的温暖な気候になっていることがわかります。

データ探索

Loading…
Loading…

これを見ると、40歳くらいを境目に、2世の方が多くなっていることがわかります。

1世の人たちの殆どは、35歳以上であり、2世の人たちの殆どは、35歳未満であることから、この溝が発生しているようです。

さて、2世の人たちの殆どが35歳未満であることは、おそらく35年前くらいから移住する人があらわれ、そこから子供が生まれ始めたということで説明がつきそうですが、なぜ、1世の人たちの殆どが35歳以上なのでしょうか?35歳くらいにならないと、移住のチャンスを得にくかったなども考えられますが、なぜ35才未満の人数がほぼゼロに近いのかは、私達の調べた範囲ではよく分かりませんでした。

もともとどこに住んでいたのかという情報も、original_addressという列にあるので、そのあたりも覗いてみましょう。

original_addressにある文字列を、google map apiで緯度、経度に直したものをマッピングすると、以下のようになります。

Loading…

ヒートマップ

Loading…

日本からの移民は、どこに多く住んでいたのでしょうか

日本生まれの人達のデータは、w_birthplace

のデータになります。

そのデータと、どの州に住んでいたかという情報をバーチャートで表示すると、以下のようになります。

Loading…
Loading…

これらのそれぞれの地域から、アメリカのどこに移住していたのか、可視化してみます。

どこに住んでいた人が、どのキャンプに送られたか

では、どのキャンプに送られるかというのは、どのようにして決められたのでしょうか。直感的に考えると、単純に住んでいるところに近いキャンプに送られるのが自然だと考えられます。本当にそうなのでしょうか。

このマップからは、どうも近くに送られているというわけでは無いように見えます。では、どのようにして送られるキャンプが決められていたのでしょうか?

変数重要度から送られるキャンプが決められている要因を見つける

他のどんな変数によってある変数が決まっているかというのは、変数重要度という指標によってわかります。分析タブの、変数重要度という分析タイプを選んでください。

そこで、予測対象の列m_campにし、何か関わっていそうな列を、重要度を調べる列で選択します

として、実行します。すると以下のような結果が出ます。

Loading…

どうも、w_assemblycenterによって、m_campがどこになるのか決まっているといえるようです。この、w_assemblycenterというのが何なのか、webで少し調べてみると、このような記述が出てきます。

出典:http://www.jomm.jp/newsletter/tayori15_02.html

ここから、最初に入れられた、一時的な収容所によって、大体どこに行くことになるか決まっていたであろうことがわかります。

assembly center feature importance
Loading…

なので、大体において、county -> assembly center -> camp という流れでどこに行くことになったのか決まっていったと考えられます。

assembly centerとcampがどこにあったのかというのをmapに表示させると、以下のようになります。

Loading…
county -> assembly bar
Loading…
assembly -> county bar
Loading…
feature importance assembly
Loading…

high f score county -> assembly center map

low f score county -> assembly center map

county -> assembly center map

どのアッセンブリーセンターから、収容所に来てるかというのをmapで表示すると、このようになります。

各地から、アッセンブリーセンターに集まり、そこからキャンプ地にどう移動したか示すマップがこちらになります