ここでは、EDASalon 第7回 : オリンピックデータを用いて、「夏季」オリンピック選手のリピート率を探索してみました。
オリンピックに出場するというのは、凡人の私には遠い遠い世界の話なんですが…毎回オリンピックのシーズンになると、ニュースでは「hoge選手はn年連続m回目のオリンピックです!」みたいな紹介をよく見るので、そもそもオリンピックのリピート率ってどんなもんだろうか?と思ったので探索してみました。とはいっても、主な興味の対象はF2転換率です。
まずはオリンピックのデータを確認しておきます。リピート率を計算する上で、選手のID
とYear
が必要になるので、その2つの変数を確認すると、欠損値はありませんでした。
リピート率を算出するにあたり、集計基準となる変数はYear
であり、そのユニーク数を回数としています。
また、1回のオリンピック大会で複数のSport
、Event
に出場している選手もいますが、それは1回の出場とみなしています。
そのため、1選手のオリンピック出場回数というのは、ID
ごとのYear
をユニークにカウントしたものFrecuency
としています。また、4年間間隔での連続出場かどうかは考慮していません。
そして、リピート率(F2転換率)は、色んな計算方法がありますが、「F2の値/F1の値」、F3転換率は「F3の値/F2の値」…と計算しています。F2転換率とか出てくると、すごくマーケティングの分析みたくなりますが、今回のオリンピックデータはwebのログとか、注文履歴と同じようなもんなんで、解釈さえ違和感なければ、マーケティングの分析で使われる一般的な手法は使い回せますね。
【備考】
F2転換率とは、初回購入を行った新規顧客のうち、どれくらいの顧客が2回目購入を行ったか、2回目購入への転換率を意味します。
Source | 通販CRMうちでのこづち~F2転換率
まずは全体のリピート率を可視化してみます。棒グラフは、出場回数ごとの選手のユニーク数の分布で、折れ線グラフはリピート率の推移です。
選手のユニーク数の分布をみると、圧倒的にF01が多いことは探索する前から明らかですが、F02もおよそ20%くらいはいるみたいです。F2転換率はおよそ26%なので、オリンピックに出場した選手の1/4は2回目のオリンピックの出場するようです。
基本的には、全体と変わりないですね。F2転換率はおよそ23%なので、全体に比べると3ポイント低いです。
さらにスポーツ別に限定します。ここではF04以上のSport
に限定しています。まずはF2転換率のグラフを見ると、Table Tennis(卓球)、Triathlon(トライアスロン)、equestrianism(馬術)が高いようです、Table Tennis(卓球)は45%なので、2人に1人は2回目のオリンピックに出場するようです。
オリンピックのデータなので、推移は下がっていくか、山のように推移するので、equestrianism(馬術)除けば、自然なグラフですね。
というかequestrianism(馬術)すごいな。この人にいたっては6回もでてるみたいですね。
ここでは夏のオリンピック(1896年~2016年)のF2転換率を調べてみました。結果、全体でみるとF2転換率はおよそ26%でした。個人的には、結構高い印象です。
他にも国別、スポーツ別などでやってみると、おもしろい発見があるかもしれませんね。