ワシントンDCの自転車乗りはクイックシルバーなのか?

内容

9月のEDAsalonのテーマ「自転車のレンタルデータ」でネタを考えいていたが、アイデアがなく日々過ごしていたが、わさびさんのエクステンションデータを使って面白そうなEDAができそうだったので、やってみた。
わさびさんに感謝。

レンタル自転車の利用履歴記載の
* Start station
* End station
の緯度経度(lat., long.)から利用者の移動距離と移動(利用)時間を推定。彼女・彼らがあの有名なクイックシルバーのようなスピード狂いなのか検証した。 1

検証結果

スピード狂いはどうかはわからなかった。ただ、利用時間は30min以内が大半の可能性が高い。

検証方法

わさびさんの投稿をベースにデータを組み立てた。 https://exploratory.io/note/1021500949444839/RCY6pZN4SO

データはすべて、わさびさんのEDFデータを流用させていただいた。ありがとうございます。

検証方法は以下の通り。
1. Start St. End St.の緯度経度から、2点間の距離を計算。 その際、実際の経路が未定のため、2乗根(sqrt(x^2 + y^2)計算と、単純加算(x + y)加算の二通りの計算を実施。
2. 1で求めた移動距離に対して、自転車の時速を除して、移動時間を計算。 ここでも速度が未定のため自転車のおおよその平均時速の最小・最大(12km/hと30km/h)の二通りの計算を実施。

時速12km/h 時速30km/h
2乗根距離(sqrt(x^2 + y^2)[m] パターン1 パターン2
単純加算距離(x + y)[m] パターン3 パターン4
  • パターン1:最短距離をのんびり(玄人向け)
  • パターン2:最短距離を最速で(クイックシルバー)
  • パターン3: 長めの距離をのんびり(観光客向け)
  • パターン4:長めの距離を最速で(初級クイックシルバー)
    ↑※完全にイメージです。

データ分析

繰り返しを使って、分析チャートを並べて表示した(上のテーブルと同じ位置関係にしている)

Loading...

各条件の中央値を見ると、大半の人は3minから9minの間、自転車に乗っているようだ。意外に短い。 これは、ワシントンDCのエリアは周囲10kmも無いので、時速12km/hで自転車を漕げば、すぐに目的地に着いてしまうだろう。 (右下に2kmのスケールバー有)

まとめ

新たなエクステンションデータを利用することで、面白いインサイトを得る可能性を見つけた。

今回のデータは米国のものだったので、英語でググってみると意外に関連データが見つかるものなんだなと実感した。

なお、観光客のように、明確な目的を持たずに、サイクリングをするユーザーは、これらの仮定(距離の計算、自転車の速度)はそぐわないだろう。

Capital bikeshareのHPを見ると、料金体系が載っている。その一文に

Passes include unlimited classic bike trips under 30 minutes.

つまり、30分以内なら何回乗ってもいいよということらしい。サービス的にも、長時間の乗りっぱなしは想定していないようだ。 https://www.capitalbikeshare.com/pricing/day-passes


  1. 冒頭10分しか見てない。ケビン・ベーコンは好きです。