こんにちは!

Exploratoryの西田です。

先週は台風18号が日本列島を縦断したようですが、みなさんは大丈夫ですか?こちらUSのほうでもプエルトリコがハリケーン・マリアに破壊されて今後2、3ヶ月は電気、水道が戻らない等と言われています。なんだか台風にしろ、ハリケーンにしろ最近は来るたびに規模がでかくなっているみたいですが、みなさんも気をつけてください!

それでは今週もアップデートの方をお届けします。

最近の興味深い英文の記事

自動運転の世界では勝者が全てを独占する

Winner-takes all effects in autonomous cars - 8/20 - URL

いよいよ全ての自動車が石油でなく電気になっていくことで、これから自動車産業も、PC、モバイルが辿った道と同じ道をたどることになります。つまり、ハードウェアがあって、バッテリーがあって、センサーがあって、CPUがあって、それらを制御するソフトウェアがあるということです。そして自動車の部品に当たるものは全てコモディティ化されるのに対し、高い付加価値があるのはソフトウェアの部分だけとなるでしょう。こちらで、もともと特にモバイル関連の気鋭のアナリストとして有名で、現在はA16Zというベンチャーキャピタルにいるベネディクト・エバンスが最近書いたこれからの自動運転の時代のネットワーク効果に関する考察は一見に値します。この新しい業界のエコシステムとはどういうものなのか、この業界を独占することになる次のApple、Googleのような会社というのはどこから出てくるのかに関しての考察です。日本の将来にとって、これは大変懸念されるべきことです。鍵はデータです。

この新しいエコシステムのなかで何が一番ネットワーク効果があるのでしょうか。それは地図かもしれません。たくさんの車が走れば走るほど地図やナビゲーションに必要なデータが増え、その分クオリティが上がるので先に参入したものに市場を独占するチャンスがあります。また、AIつまり機械学習もネットワーク効果があります。つまり自動運転のためのデータを集めれば集めるほどそのクオリティは上がるはずだからです。なのでこちらも、先に参入したものが市場を独占するチャンスがあります。例えば、Google傘下の自動運転の車を作るWaymoという会社はすでに公道で毎週25,000マイルの実運転、さらに毎週平均して1900万マイルのシミュレートされた運転を行っています。そして、もちろんTeslaもすでに自動運転モードをサポートしていますし、実際に運転している人たちの車から走行に関するデータを集め始めています。

現在のWindowsベースのPCやアンドロイド・ベースのスマホを作ってる会社のように、これから多くの自動車会社がシリコンバレーのテクノロジーをOEMするようになるでしょう。そうすることで、PCやモバイルで起きたように、ほとんどの利益とデータはそのままそうしたテクノロジーのベンダー企業に吸い込まれていきます。そしてそういったハードを作る会社が作り出す製品は作った瞬間にコモディティとなってしまうわけです。

タクシー・メダリオン - 以前は確実に儲かる投資が、今は破産の道への街道

Taxi Medallions, Once a Safe Investment, Now Drag Owners Into Debt - 9/10 - URL

ニューヨークといえば、イエローキャブですが、あれって実は運転手の人たちがメダリオンと呼ばれるライセンスを先に購入する必要があるんです。(もちろん、他の人が買ったライセンスをリースしながらやるというやり方もありますが。)たとえば、この記事に出てくる人は3000万円ほど($335,000)借りてそのライセンスを購入したそうですが、最近はすっかりUberやLyftといった配車サービスに客を取られて全く商売にならないようです。イエローキャブは一年前、一日あたり332,231回の乗車があって、$4.9 millionほどの稼ぎがあったのに比べ、この7月には277,042回の乗車で、$4 millionほどの売上に落ちてしまったようです。こうして現在、借金を返せない運転手が多くなってきてるようです。そういえば、前回日本からサンフランシスコに帰ってきた時に乗ったタクシーの運転手も同じことを言って怒ってました。この記事の中に出てくる運転手のコメントで、”Everything changed overnight.” と言っていますが、シリコンバレーもしくは最近のテクノロジーの進化のスピードの中で暮らしていない人たちにとっては、まさにそんな感じのインパクトなんだろうなと思います。

興味深いデータ

USの郡ごとのインターネットアクセスの数 - URL

アメリカのFCC(Federal Communication Commission)が郡ごとに集めている居住者用と商業施設用ごとのハイスピード(といっても250kbpsですが。。。)インターネットのアクセス数がこちらに公開されています。アメリカは広いので地域によってかなり差があるのがわかります。英語ですが分析結果をこちらに公開していますので、マップの可視化だけでも見ると面白いと思います。

USの不動産価格インデックス - URL

1991年から直近まで州、都市、地域(Census Divisions )ごとのUSの家の値段のインデックスです。地域ごとのデータのダイレクトリンクはこちらです。このデータは、ワイド・データですので、Gatherのオペレーションをしてロングにすると、その後の分析が楽になります。こちらにデータラングリングのサンプルを共有しておきましたのでぜひEDFをダウンロードして、Exploratoryにインポートしてみてください。

過去に起きたデータ漏洩事件のリスト - URL

最近こちらで一般の人達のクレジットスコアなるものをつけているEquifaxという会社の管理している個人情報データがハックされました。(URL) 一億4300万人ほど、つまりUSの人口の半分以上の情報です。こちらのWikiのページに過去に起きたデータ漏洩のリストがあります。ぜひサクッとExploratory使ってスクレイピングしてみてください。

ブログポスト from Team Exploratory

こちらに、最近Team Exploratoryのメンバーが書いたブログポストがありますので、よろしければ参考までにチェックしてみてください。

What We Are Working On?

引き続き、次期リリースに向けての開発に集中しています。後2週間ほどで仕上げるために最後のラッシュをかけています。現在、チャートごとにフィルターを設定することができる機能を作ってます!

ブートキャンプ・トレーニング

最後になりますが、10月の下旬にこのシリーズ最後の日本でのデータサイエンス・ブートキャンプ・トレーニングを開催します。もし周りに興味のある方などいらっしゃいましたら、ぜひお声をかけていただければと思います。よろしくお願いします!

それでは、素晴らしい一週間を!

西田, Exploratory/CEO