9月のEDAsalonのテーマ「自転車のレンタルデータ」でネタを考えいていたが、アイデアがなく日々過ごしていたが、わさびさんのエクステンションデータを使って面白そうなEDAができそうだったので、やってみた。
わさびさんに感謝。
レンタル自転車の利用履歴記載の
* Start station
* End station
の緯度経度(lat., long.)から利用者の移動距離と移動(利用)時間を推定。彼女・彼らがあの有名なクイックシルバーのようなスピード狂いなのか検証した。 1
スピード狂いはどうかはわからなかった。ただ、利用時間は30min以内が大半の可能性が高い。
わさびさんの投稿をベースにデータを組み立てた。 https://exploratory.io/note/1021500949444839/RCY6pZN4SO
データはすべて、わさびさんのEDFデータを流用させていただいた。ありがとうございます。
検証方法は以下の通り。
1. Start St. End St.の緯度経度から、2点間の距離を計算。 その際、実際の経路が未定のため、2乗根(sqrt(x^2 + y^2)計算と、単純加算(x + y)加算の二通りの計算を実施。
2. 1で求めた移動距離に対して、自転車の時速を除して、移動時間を計算。 ここでも速度が未定のため自転車のおおよその平均時速の最小・最大(12km/hと30km/h)の二通りの計算を実施。
時速12km/h | 時速30km/h | |
---|---|---|
2乗根距離(sqrt(x^2 + y^2)[m] | パターン1 | パターン2 |
単純加算距離(x + y)[m] | パターン3 | パターン4 |
繰り返しを使って、分析チャートを並べて表示した(上のテーブルと同じ位置関係にしている)
各条件の中央値を見ると、大半の人は3minから9minの間、自転車に乗っているようだ。意外に短い。 これは、ワシントンDCのエリアは周囲10kmも無いので、時速12km/hで自転車を漕げば、すぐに目的地に着いてしまうだろう。 (右下に2kmのスケールバー有)
新たなエクステンションデータを利用することで、面白いインサイトを得る可能性を見つけた。
今回のデータは米国のものだったので、英語でググってみると意外に関連データが見つかるものなんだなと実感した。
なお、観光客のように、明確な目的を持たずに、サイクリングをするユーザーは、これらの仮定(距離の計算、自転車の速度)はそぐわないだろう。
Capital bikeshareのHPを見ると、料金体系が載っている。その一文に
Passes include unlimited classic bike trips under 30 minutes.
つまり、30分以内なら何回乗ってもいいよということらしい。サービス的にも、長時間の乗りっぱなしは想定していないようだ。 https://www.capitalbikeshare.com/pricing/day-passes
冒頭10分しか見てない。ケビン・ベーコンは好きです。↩