こんにちは、Exploratoryの西田です。

USでは夏休みがいよいよ終わり、今週から学校が始まります。私の5歳の息子も今週からKindergarten(幼稚園)です。こっちのKindergartenは小学校の一部なので、いよいよ人生の次のステージに進み始めたのだなと思うと、時間の経つ速さに圧倒されてしまいます。

私達Exploratoryも、「データサイエンスの民主化」をうたって立ち上げてから、かれこれ3年ほどの時間が経ってしまいました。しかしその間にデータサイエンスの民主化は世の中で起きたのかと言うと、全然まだまだ、というのが現実です。

そのことに対する焦りや失望のようなものがあるのは否定できませんが、そもそもそんなに簡単な問題であれば人生を賭けることもなかったはずです。ここは腰を据え、長期戦ということで、一歩一歩全力で、私達の持つ夢の実現に向かって走っていければと思っています。

遅くとも、現在5歳の息子が小学校を卒業するまでには、データサイエンスが当たり前になりすぎて、この言葉が消滅してしまうほどにデータサイエンスを民主化したいと思います。

引き続きよろしくお願いします!

ところで告知ですが、毎回好評いただいているデータサイエンス・ブートキャンプは次回11月に開催です。

早割のほうが今月いっぱいですので、興味のある方はこの機会にぜひご検討下さい!

詳細を見る

それでは、今週のWeekly Update、さっそくいってみましょう!

最近の興味深い英文の記事

因果と予測 - 言語学の世界でも起きている統計と機械学習という2つの文化の対立

機械学習と統計学、予測と因果など、これまでにもこうした違いについて何回か取り上げてきました。

実は言語学、自然言語の研究分野でもこうした違いに関しての論争があります。その中でも有名なのは、近代の言語学の父とも言われるノーム・チョムスキーと、AI分野の第一線の研究者でGoogleの研究部門のディレクターでもあるピーター・ノーヴィグの間でのものです。

そのことについて触れながら、予測と因果関係に関する2つの文化の違いについてまとめている「Predicting vs. Explaining」というおもしろい記事があったので紹介します。

続きを読む。

2年国債の金利と10年国債の金利の逆イールドはリセッションの前兆か?

先週は、USの2年国債の金利と10年国債の金利が逆転する逆イールドになったため、いよいよリセッションがやってきたと大きなニュースになっていました。

  • Main yield curve inverts as 2-year yield tops 10-year rate, triggering recession warning - Link

もし、あなたが誰かにお金を100万円貸すとして2年で返してくれるのなら毎年5%の金利でいいとしたとします。しかし、10年で返すという人にはもっと金利を増やしたいのではないでしょうか。なぜなら10年という長い単位では返してもらえなくなるリスクが大きいからです。

国債の金利も同じで、普通は10年国債のほうが利子は高いはずです。それが2年国債の利子のほうが高いということは、投資家の人たちは短期的な返済ですらリスクが大きいと思っているということなので、それではこれからリセッションが来るのではないか、ということで大きなニュースになっていたようです。

なんでも前回このように逆転したのは2005年の12月でそれは金融危機によるリセッションがはじまる2年ほど前でした。さらに、歴史的に見るとこうした逆イールドが起きると、その後平均して22ヶ月後辺りにリセッションが始まると金融業界では言われているようです。

ところで、このUS国債の過去の金利のデータはFREDというFRB(Federal Reserve Bank / 連邦準備銀行)がデータを公開しているウェブサイトからとってくることができます。

こちらに2年国債と、10年国債の金利のデータをとってきて、過去30年の金利のトレンドを可視化してみる、というブログポストを書いたので興味のある人は参考にしてみて下さい。

一時Yahooに1000億円で買収されたTumblrの価値は今はたったの3億円

Tumblrという一時人気のあったマイクロ・ブログのサービスがあったのですが、最近WordPressというブログプラットフォームを提供しているAutomaticという会社がVerizonという会社から3億円くらい($3ミリオン)で買いとったというニュースがありました。

Tumblrは今から5年前の2013年に、元Googleのマリッサ・マイヤーという人がCEOだったときのYahooに約1200億円超($1,097ミリオン)で買収されたのがまだ記憶に新しいですが、それに比べて、価値の落ち方が凄まじいと思いました。

以下は、Tumblrの価値が誕生から10年どのように変わっていったかをチャートにしたものです。(chartrという先週も紹介したサービスから出てました。)

実は、ベンチャーキャピタルというのは、基本的には、投資したスタートアップがエグジット(株式公開か、買収)した時にしか資金(そしてうまく行けばリターンも)を回収することができませんが、この場合は、Yahooが約1200億円払った時にボロ儲けしているわけです。Cラウンド(3回目のラウンド)で参加した投資家でも10倍超のリターンがあったわけですから、かなりおいしい投資だったわけです。

しかし、このTumblrのビジョンやサービスが好きで集まった多くの社員や、そのユーザーたちにとっては、まさにこのYahooに買収されたときがまさに「終わりの始まり」だったということになります。

買収されたときは、Yahooの中でも独立したビジネス、サービスとやっていくと聞こえのいいことを言っていましたが、やはりどうしても買収という毒薬の効き目から逃れるのは至難の業だと思います。

私も昔オラクルでたくさんの買収された企業を見てきましたが、ほぼ100%、買収されたチームからスタートアップに特有の危機意識がなくなる、社内政治に翻弄される、文化が合わない、ということで、ある程度のお金を獲得したトップレベルの人間から辞めていき、その後他のスタートアップでやっていける優れている人材が抜け、残ったチームは、もともとオラクルにいたお役所仕事的な人間によって管理されていくという道をたどることになります。

そんなチームによって作られるサービスが顧客やユーザーにとっていいものになるはずがないので、結局は顧客が去っていくことになり、そのことによってビジネスも縮小していくことになります。

なので、競合が買収されると、資金力の大きい親会社からの攻勢が始まるとか、シナジーが何だとかいう話が出てきますが、たいていの場合はまさに、「終わりの始まり」のシグナルなので、結果的にはグッド・ニュースだと言われるのはこれが理由です。

もちろんFacebookに買収されたInstagramのような例外もありますが、それは異常値だと捉えたほうが現実的だと思います。


Quote of the Week

“Any intelligent fool can make things bigger and more complex. It takes a touch of genius — and a lot of courage — to move in the opposite direction.”

どんな知的なバカでも物事をより大きくしたり、より複雑にしたりすることはできる。その逆の方向に行くためには、ほんの少しの天才とたくさんの勇気が必要だ。

アルバート・アインシュタイン


What Are We Working On?

Exploratory v5.3.2

まだ、Exploratory v5.3のパッチがリリースできずにいます。現在、結構な量の機能強化とバグの修正を行っています。なんとか今週末までには出したいと思っています!


最近書いたHow-to記事

  • 国名から地域名や国コードを生成する方法 - リンク
  • 箱ヒゲ図を使ってカテゴリごとに数値の分布を可視化する - リンク

Exploratory データ・アカデミー

EDAサロン

探索的データ分析を実際にやりながらオンラインで学ぶ場として「EDAサロン」をやっています。

今月8月は世界の家畜生産量データです。

詳細はこちらのページにあります。誰でも参加できるので、ぜひカジュアルに参加してみてください!

最近、Team Exploratory村里が彼の分析結果をノートにして出しています。参考にしてみて下さい。

  • 家畜の生産において独自性が強い国はあるのか? - リンク

Exploratoryアワー

毎週火曜日のお昼12時はExploratoryアワーです。

Exploratoryのユーザーの方からいただいた、データに関する質問にライブデモを通して答えています。

先週は、以下の2つの質問に答えました。

  • 国の数だけある列を一つの国の列にしてまとめたい
  • 国名から国コードや地域名を生成できますか?

詳細や過去の録画はこちらのページにあります。

Exploratory オンラインセミナー

毎週木曜日、20日の午後12時(日本時間)はオンラインセミナー(無料)です。

先週は線形回帰の基礎の紹介でした。録画とスライドはオンライン・セミナーのページにアップしてあります。

詳細を見る


データサイエンス・ブートキャンプ、11月開催!

毎回好評をいただいているデータサイエンス・ブートキャンプですが、次回は11月です!

データサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使えるようになりたいという方は、ぜひこの機会に参加をご検討ください!

詳細を見る


それでは、今週は以上です。素晴らしい一週間を!

西田, Exploratory/CEO
KanAugust(Twitter)


こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。