留学生が多く在学するほど、大学ランキングが高いのか分析した。
日本のある大学では、人口減少で日本人入学生が減少傾向にある。その代わりに、収入を増やすために経済発展途上国からの留学生を積極的に受けて入れている実情がある。 この場合の留学制度は(学生の能力はおいといて)、学校の経済活動のために行われる傾向が強く、大学のスコアを伸ばす原動力になりにくいと考えた。そこで、今回はランキング100位に入る大学を対象に留学生数と大学スコアの関係を分析した。
今回の分析は、問題提起として単純な散布図で行った。
当初、total_scoreを大学ランキングの代替指標としてX軸に採用し、Y軸に留学生数(International_students)を採用。下グラフのようになった。
大学ランキングが増加すると、留学生が増加or減少するのか
を分析することである。(大学がどのスコア帯にどのように分布しているかを分析するのではない)。
つまり、total_scoreをX軸にすると、データの密度という情報が(今回は)余計に含まれてしまった。
なので、X軸には一意な値である大学ランキングを選択した。
X軸:大学ランキング
Y軸:留学生数
上のworld_rank vs international_studentsの散布図からわかることは、
1.ある一定数はどのworld_rankでも留学生は居る
2.上位(25位以上)のworld_rankでは、留学生の割合の下限が上がってくる。
つまり、
大学ランキングが高いほど、留学生が居ない割合は減ってくる(表現が難しい。。。)
ちなみに、、
サマリのtotal_scoreデータのオプションから
これだけを残す…
を選択し、
一意な値(unique)
を選択すると、415行が残る。つまり、もともと2603行(大学数)あったが、total_scoreが一意なのは415大学のみなのだ。多くは重複している。この一意の415行をX軸にすると、スコア自体の分布が不均一になるので、これもまたX軸のデータとしては不適切と考えた(world_rankなら、ステップ1で分布は均一である)
大学ランキングが高いほど、留学生が居ない割合は減ってくる(表現が難しい。。。)
これは本分析の目的で述べた、”日本のある大学が行っている収入目的のための留学生受け入れ”とは異なる結果だった。
しかし、因果関係をこのグラフだけで完全に読み取るのは難しい。 なぜなら、
1.留学生の存在が大学ランキングを上位に押し上げてるのか。
→留学生の学力が自国学生より高い?
→留学生がランキングの影響因子なのか?
2.ランキング上位の大学は留学生を呼び込む魅力がある。あるいは積極的に留学生を受けて入れている。
→留学生数の割合変化はランキングによる結果なのか?
判断はできない。この辺りの分析方法は今後引き続き評価して報告していく。