こんにちは、Exploratoryの西田です。
最近はExploratoryサロンとExploratoryアワーの立ち上げ、また今週末から始まる7月のブートキャンプの準備、それに伴うExploratory v5.3のリリースの準備に追われていました。
さっそくですが、まずはEDAサロンというのをはじめました。これは毎月私達がお題として出すデータをいっしょに自由に可視化したり分析してみるというオンラインのイベントです。
誰でも参加できるので、皆さん是非参加してみてください!詳細は下の方にあります。
次に、今週末より7月のデータサイエンス・ブートキャンプのために日本に行きますが、そのさい、29日(月)の夜7時からデータサイエンス勉強会(無料)をやります。興味のある方はこちらの詳細ページよりお申し込みください。
ところで、データサイエンス・ブートキャンプの方ですが、次回は11月の開催が決まり、さっそく受付を開始しました。
現場ですぐに使えるデータサイエンスや統計の手法を1から体系的に習得したいという方はぜひこの機会にご参加を検討ください!
最後に、今週も木曜日にオンライン・セミナーやります!今週は、データの中から似ている者同士を発見する時に便利な「距離」のアルゴリズムの紹介です。興味のある人はぜひご参加ください!
それでは、今週のWeekly Update、さっそくいってみましょう!
これまで、2回にわたって、 「A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks」という因果推論に関する長文エッセイを紹介してきましたが、これでいよいよ最終回です。
今回は、意思決定という観点から予測と因果の違いについて見ていきます。
もう数週間前になりますが、日本でのG20の大阪サミットの際に、データに関連するおもしろい発表がありました。
“Data Free Flow with Trust” という日本が数年前から提唱しているビジョンのもとに、それを実現するための「大阪トラック」というイニシアチブの発表でした。
これは素晴らしい取り組みであり、まさに日本こそが大きくリーダーシップを発揮できる領域でもあるので、ぜひ頑張ってもらいたいところです。これに関する簡単な考察をまとめました。
Weekly Updateでも過去に何回かとりあげてきましたが、カスタマーのエンゲージメントを上げることこそが、特に昨今のSaaS / サブスクリプション型のビジネスにとっては重要です。
そこで今回は、なぜエンゲージメントこそがSaaSビジネスにとってもっとも重要な指標なのかというのを、7つの理由にまとめてある記事を、Team ExploratoryのIkuyaが訳しましたので、ぜひ参考にしてみて下さい。
最近おもしろいAmazonに関するチャートを見かけました。
以下は、Amazonの商品の配送を行っている配送会社のシェアを2017年から時系列で表したものです。
Amazonのほぼ半分の商品の配送はすでに自分たちの配送手段(飛行機、トラックなど)が使っているとのことです。
現在Eコマース全体の40%ほどがAmazonらしいので、単純に考えてUSの全配送の20%はすでにAmazonがやっているということになります。
ちなみに、現在AmazonはUSの配送会社大手である、FedEx、UPS、the United States Postal Service(郵便局)のどこよりも多くの従業員を抱えています。
そして、輸送のための飛行機を50機、トラックの頭の部分を300台、トレーラーの部分を数千台、地域の配送に使うバン(ワゴンの大きいやつ)を2万台ほど所有しているらしいです。
配送というのはまさにデータとAIを使っていかに効率的に配送センターを配置し、配送のルートを設計していくかが問題になります。Amazonはデータをうまく使うことで、低コストで同日配送を可能にします。使っている方からしても、配送の時間はコストが上がることなしにどんどんと速くなっていくばかりなので、これでは既存の配送業者もなかなか太刀打ち出来ないのではないでしょうか。
Software is eating the worldの発展形の形でData is eating the worldということが起きているという話をたまにしますが、まさに今、Amazonは配送会社をSoftware、Data、AIを使って飲み込み始めている最中です。
もう、Amazonは物流会社として捉えたほうがいいかもしれませんね。少なくともUSではすでにそうなっています。
Graphs force us to note the unexpected; nothing could be important.
グラフ(チャート)は我々が期待もしていなかったようなことに気付かせてくれる。それよりも重要なことはない。
ジョン・テューキー
Exploratory v5.3のリリースが近づいてきました。なんとか今月中には正式版をリリースできると思います。
今回は、このリリースの一つの目玉機能であるチャートの「値を制限する」という機能を紹介します。
これによって、例えばバー・チャートでバーの数が多いときなどにその数を条件によって制限することができるようになります。
例えば、以下は国ごとの売上をバー・チャートで表していますが、国の数がもあるので、よくわからないチャートとなっています。
そこで、「値の制限」という機能を使って上位30の国だけを表示することができます。
また、「条件」を使うこともできるので、例えば、「注文件数が100件以上」の国の売上を表示したい、というようなこともできるようになります。
探索的データ分析をみんなで学ぶ場として「EDAサロン」始めました!
毎月こちらからデータを出題しますので、データを探索的に分析して自分にとっておもしろいと思うような、気づきやインサイトをみんなと共有してみませんか?
今月は世界のトップ大学(日本の大学も結構入ってます)のランキングデータです。このデータを自由に可視化したり、分析したりして、チャートやノートをEDASalonというタグをつけてパブリッシュしてみてください。
すでにTeam Exploratoryの何人かがTwitterとExploratory.ioの方で共有しているのでチェックしてみてください。
詳細はこちらのページにあります。誰でも参加できるので、ぜひカジュアルに参加してみてください!
毎週火曜日のお昼12時はExploratoryアワーということで、Exploratoryのユーザーの方からいただいた、データに関する質問にExploratoryを使ったライブデモを通して答えています。
それぞれの質問と答えは5分から10分ほどです。Exploratoryユーザーの方は、お気軽に参加してみてください!
詳細はこちらのページにあります。
これまで以下のような質問に答えています。
質問も随時受け付けています!
毎回好評をいただいているデータサイエンス・ブートキャンプですが、次回として11月の開催が決定しました!
データサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使えるようになりたいという方は、ぜひこの機会に参加をご検討ください!
それでは、今週は以上です。素晴らしい一週間を!
西田, Exploratory/CEO
KanAugust(Twitter)
こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。