大学ランキングTOP50の大学はどのスコアが高いのか

目的

  • ランキングTOP50の大学にはどのような変数が影響しているのか
  • 学校のスコアや属性に基づいた、 地域的なパターンはあるか

TOP50の大学の変数重要度

TOP50の大学に論理値でTRUE/FALSEをいれた。

ランダムフォレストで目的変数をTOP50にしてみてみる。

Loading...

researchとteachingとcitationsの変数が影響度が高いことがわかった。

予測影響度で確認

Loading...

たしかに、先ほどの変数がTOP50に影響しているようだ。

次に、ロジスティック回帰で目的変数:TOP50にしてみてみる。

Loading...

以下の4点が、大学ランキングに影響を及ぼしている。

  • International_students
  • research
  • citiations
  • teaching

チャートで確認してみる。 X軸にteaching、Y軸にresearch、サイズにcitations、色にworld_rankのint(10)にしている。

Loading...

ランキングが高いほどこれらの数値の水準が高いことがわかった。

これらの結果を見て、優秀な教授がいる大学は、その授業を受けたいために世界のTOP学生が集まるのではないかという仮説が浮かんだ。

目的変数を:international_studentsにして線形回帰をかけてみる。

Loading...

Internationalとteachingがpositiveで有意に、num_studentsとincome、female_ratioがNegativeで有意になっている。

そのため、teachingが高くなると、international_studentsが増えるということがわかった。

地域的なパターン

地域的なパターンを見ていくために、地域ごとに値を集計してK-meansでクラスタリングしていく。

  • University_count
  • International_students
  • research
  • citations
  • teaching

K-meansをみてみると、

Loading...
  • 1はUSのみで、ランキング入りしている大学の数が桁違いだ。
  • 2は各変数の値の水準が高い
  • 3はどれも水準が低いことがわかった。
  • 4は大学の数が多い
  • 5はどれも平均的

マップで見てみる

Loading...

国土面積と大学のランキングに入っている大学数が比例しているように見える。(日本は例外)

また、アフリカからのランク入りは少ないが、ヨーロッパは多く見える。 先進国と途上国で教育の格差があるからかもしれない。

結論

  • teachingが高くなるほど、International_stundentsの数値が高くなるために、優秀な教授陣がいる大学は世界から学生が集まりやすいのではないか。
  • 地理的なパターンでは、国の経済発展と教育があるのではないかと疑問が浮かんだ。次のステップとしては、国のGDPとteachingのスコアの関係性をやりたいと思った。