こんにちは、Exploratoryの西田です。

今週はスキー・ウィークと言って一週間ほど学校が休みです。どう考えても先生たちのためにできたような休暇です。それはさておき、この時期に合わせみんなTahoe(ここから来るまで3時間ほどいった、カリフォルニアとネバダの間)という山脈地域へスキーをしに行くのですが、大雪のため道路が途中で封鎖。そのせいでスキーに行く気満々で準備してたけど行けない欲求不満な人たちが街全体にあふれています。(そんな気がするだけかもしれませんが。笑)

ところで、次回3月のブートキャンプ・トレーニングは平日版は定員いっぱいになりましたのでが、週末版にまだ席の空きがあります。ビジネスの現場で使えるデータサイエンスや統計の手法を1から体系的に学びたいという方は、この機会にぜひ参加をご検討してみてください!

ブートキャンプ詳細を見る

また、今年5月より、「アナリティカル・シンキング」を営業・マーケティング分野に応用したトレーニングを開始する予定ですが、そのプレビューを兼ねたセミナーを行います。興味のある方はぜひご参加ください。3月13日(水)の夕方6:30PMからです!

セミナー詳細を見る

それでは、今週のWeekly Update、さっそくいってみましょう!

最近の興味深い英文の記事

アメリカのAI戦略2019

ようやくでてきました、トランプ政権下初のアメリカのAI戦略。

  • Executive Order on Maintaining American Leadership in Artificial Intelligence - Link

現在のところ、中身に具体性が乏しく、さらに具体的な予算が取れているわけではないので、評価が難しい側面はありますが、それでもAIがビジネス、社会に与える影響を考慮した現実的な戦略ではないかと思います。

興味深いポイントとしては以下の3つかなと思います。

  • AIのアプリケーションを作るために政府データへのアクセスを簡単にする
  • 労働者への再トレーニング
  • 市民の間にAIへの信頼を構築する

それでは、それぞれの詳細に関する考察を見てみましょう。

続きを読む。

ヒット曲はラジオでなくSpotifyが作る時代に

これを読まれてる人たちの多くはSpotifyやApple Music(またはYoutube)のようなストリーミング・サービスを使って最新の音楽を発見したり聴いていると思います。

そのことは最近ではあまりにも当たり前になってたので、すっかり忘れてたのですが、ちょっと前までは(といっても10年前ほどですが)ラジオのDJというのがどういう曲が流行るのかどうかというトレンドを作っていたりしたものです。(少なくともUSでは。)

ところが今のようなストリーミング・サービスで音楽を聴くのが当たり前になっている時代には、その役割はすっかりと変わってしまったようです。

つまり、ラジオは今となっては公共放送(日本だとNHKみたいなもの)のようなものになっているということをうまく可視化してまとめている記事が出ていたので、要約して紹介します。

続きを読む。

アメリカの大企業のAIとビッグデータの導入に関する調査結果

New Vantage Partnersというアメリカのデータにフォーカスしたコンサルティング・ファームがアメリカの大企業のAIとビッグデータの採用に関する最新状況の調査結果を”Big Data and AI Executive Survey 2019 ”としてまとめたレポートを出していました。 

インタビューされた企業はアメリカの昔からある大企業で、シリコンバレーにあるようなデータ・AI先進企業は入っていません。

それでも、そのリストはフォーチュン100レベルの企業で、特にビッグデータに関しての導入は昔から積極的に行ってきている企業なので、日本の企業にとっては参考になるのではないかと思いこちらで要約という形で紹介しています。

続きを読む。


Quote of the Week

“Technology is beneficial as a labor-saving device, but we should not expect machines to do our thinking for us.” 

テクノロジーは作業の時間を減らすのには役に立つ。しかし、マシンが私達のために思考もやってくれると期待すべきではない。

by Nate Silver


What Are We Writing?

先週は、以下の記事を書きました。

  • 自動運転ソフトウェアを国が審査? - 宗教的にじゃなく、サイエンス的に考えればよいという話 - Link

    ちなみに、宗教がいらないとか言っているわけではありません。両方、人間には必要だと思いますが、世の中のことを着実に改善していきたいのであれば、サイエンス的に考えることは重要です。そのことについてまとめてみました。

  • 2018年の自動車事故での死者数に関しての考察 - Link

    また、最近テスト的にやっているのですが、Twitterでデータを可視化したものをレポートしてたりします。もしよかったら見てみてください。


What Are We Working On?

Exploratory v5.1

引き続きv5.1のリリースのための準備をしています。リリースは来週末を予定していますので、楽しみにしていて下さい!

今回のリリースはアナリティクスのエリアにもおもしろい新機能が入ってきますが、2つほどここで紹介します。

Boruta(ボルータ)

ランダムフォレストを使うと、どの変数が自分の興味の対象の変数を予測する上で相対的により重要なのかを理解することができます。

しかしここで2つの問題があります。

  • 1つ目は、選択されている予測変数は全てターゲットとなる変数への影響があるといえるのか。意味のない変数もあるのではないか。
  • 2つ目は、ランダムフォレストのランダム性によって、毎回変数重要度の順位が違ってくるのが紛らわしい。特に他の人に説明しなくてはいけない場合に。

この2つの問題を解決してくれのがこのBorutaというアルゴリズムで、これがアナリティクス・ビューの「ランダム・フォレスト」に加わります!

何回も裏でモデルを作り、重要度のスコアのランダム性を箱ひげ図で表すことで、ばらつきを考慮した上で変数間の順位を比較できるようになります。

さらに、統計的手法を使うことで、どの変数が有意なのかどうなのかを判断できるようにもなります。💪💪💪

Relative Importance(相対的重要度)

線形回帰のモデルを作り、予測変数とターゲット変数の関係を理解しようとする時、「どの変数がより重要なのか、どれくらい重要なのか?」という質問が頭の中を駆け巡っていたりするものです。実際、私達が行っているブートキャンプでもよく受ける質問です。

そこで、Relative Importanceという、線形回帰の予測モデルをもとに、どの予測変数がターゲット変数の値のばらつきをより説明できているのかを検出してくれる手法があるのですが、こちらをアナリティクス・ビューに加えることになりました!🔥

セールス・アナリティクス・セミナー

今年の5月から新しく「アナリティカル・シンキング for セールス・アナリティクス」というデータサイエンス・トレーニングを始める予定です。

営業やマーケティングに関わる方たちが機械学習・統計モデルを使いこなし、ビジネスを改善していけるようになるためのトレーニングです。

そこで、この3月13日(水)に、アナリティカル・シンキングのセミナーの一部としてこちらのトレーニングのプレビューをしたいと思っています。

興味のある方は、ぜひ遊びに来てください!

セミナー詳細を見る

データサイエンス・ブートキャンプ、3月開催!

冒頭でも触れましたが、来月3月に東京でブートキャンプを行います。まだ席の方に空きがありますので、データサイエンスや統計の手法やデータ分析を1から体系的にいっしょに学びたいという方は、ぜひこの機会に参加をご検討ください!

詳細を見る


それでは、今週は以上です。素晴らしい一週間を!

西田, Exploratory/CEO
KanAugust(Twitter)


こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。