こんにちは、Exploratoryの西田です!

カリフォルニアはまた山火事のシーズンとなってきました。私の住んでいるベイエリアは大丈夫ですが、現在北部での火事がすごいことになっていて、こちらでも空が曇り、灰が少し飛んできたりしています。

ところで、この10月に開催のデータサイエンス・ブートキャンプの方ですが、すでに平日版はいっぱいとなってしまいましたが、週末版はまだ数席空きがありますので、データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方がいらっしゃいましたら、この機会にぜひご検討下さい!

詳細を見る!

それでは、さっそく今週のWeekly Updateの方いってみましょう。

最近の興味深い英文の記事

GoogleがAIに関してハイプを撒き散らし続ける3つの理由

私が昔オラクルにいた時に一緒に仕事していた仲間が現在もGoogleのCloudチームにいたり、仕事上でもGoogle BigQueryのチームとは仲良かったりしますが、それにしても、最近のGoogleは会社としてはどんどんとIBMやOracleのように悪い意味でエンタープライズ化してきていますね。その顕著な例がカンファレンスでの発表のたびに必要以上なハイプが出てくるということです。

例えば、最近のレストランやヘアサロンの予約の電話ができるといっていたGoogle Duplexですが、結局は限られたシナリオでしかまだ使えないようなデモレベルであったり、AutoMLでMachine Learning(機械学習)を自動化できるといい出したり、さらに最近だとBigQueryでMachine Learning(機械学習)ができるようになると大きな発表をしているわりには、よくみると線形回帰とロジスティック回帰のみのサポートであったり。(ちなみに、線形回帰とロジスティック回帰自体がたいしたことないと言っているわけではなりません。これらは現在でも特にデータ分析系のデータサイエンティストには最も人気のあるよく使われるアルゴリズムですし、このあたりのStatistical Learning(統計学習)系のアルゴリズムはデータの中の関係を解明していきたいようなデータ分析では非常に役立ちます。)

今回は、AIの世界でもそのタレントと研究力に定評のあるfast.aiの人たちがGoogleがなぜそういうハイプを撒き散らすのかに関しての解説が「Google’s AutoML: Cutting Through the Hype」という形でまとめられていたので紹介したいと思います。

こちらのリンクより続きの方を読んでみて下さい。

Intercomによる成功するアナリストの条件:ストーリーテリングとパートナーシップ

普段から、データ分析に関するプロジェクトでは、実際に分析を行うアナリストの人達、そうした分析結果をもとに意志決定を行うビジネス側の人達の両方から不満の声を聞くことがあります。

アナリストからよく聞くのがビジネスの方と話がかみあわない、またはデータ分析から得た興味深いインサイトをレポートしても、ビジネスの意志決定は何も変わらないといったものがあります。

こうしたギャップはどこの組織でもあるので、ほうっておいたらその溝は埋まりません。こうしたときには双方の歩み寄りが必要なのですが、私は個人的には現状ではビジネスの方がもっとデータ、アナリティクスに対する理解を持つべきだと思っています。

しかし、アナリストにも歩み寄れことがあります。今回は、シリコンバレーにあるユニコーン・スタートアップの一つ、Intercomでプロダクト・アナリストをやっているFlora Devlinからこの点に関しての役に立つ簡単なアドバイスが「Sharing the power of data through partnership and storytelling」というブログポストとしてまとめられていたので、みなさんとここで共有したいと思います。ちなみに、Exploratoryのウェブサイトの右下に出てくるチャットの機能が実はIntercomです。

こちらのリンクより続きの方を読んでみて下さい。

勘違いした意志決定をなくすには結局AIなのか、4つの事例から

このWeekly Updateの読者の方には、すでにお馴染みかもしれませんが、AI、機械学習、またはデータサイエンスといったものに対して、多くの人はOverestimate(過剰な期待)、またはUnderestimate(過小な期待)してしまいがちです。

最近では、AIに関するハイプがすごくて、つまりOverestiamate(過剰な期待)がすごいので、例えば、AIが選挙やスポーツの試合の結果の予測に失敗したり、AIが人の顔の認識を間違ってしまったりというように、その期待が外れると、やっぱりAIはだめだ、まだまだ人間でないとだめだ、という方向へ一気に触れてしまうことになります。

たしかに現在AIと呼ばれているものには限界があります。そのうちの一つがバイアスの問題です。つまり、AIのアルゴリズムで予測モデルを作った時に使ったデータにバイアスが含まれている場合にはそのモデルが予測する結果にもバイアスが含まれてしまうというものです。例えば白人だけのデータをもとに病気を予測するモデルを作った場合、黒人の患者の病気の症状を予測する時には間違えることが多くなるかもしれません。こちらのバイアスに関しては、こちらの「 全てのプロダクトマネージャーが知っておくべき5つの機械学習の限界と対策」の中でも触れています。

しかし、その限界を正しく理解してそうしたAIのテクノロジーを使いこなしていくことで、私達人間だけではなし得なかった、もしくはできたとしても非常に効率が悪かったようなことが、より正解に、さらにもっと効率的にできるようになるというのも事実です。

この件に関してハーバード・ビジネス・レビューが、「Want Less-Biased Decisions? Use Algorithms.」という記事の中で具体的な例を挙げながら説明していたので紹介したいと思います。

ぜひこちらのリンクより続きの方を読んでみて下さい。

Quote of the Week

“It’s important not to let our biases stand in the way of our objectivity. To get good results, we need to be analytical rather than emotional.”

私達の客観性にバイアスを潜り込ませることがあってはならない。良い成果を出すには、感情的ではなくアナリティカル(分析)である必要がある。

by Ray Dalio, Founder/Chairman of Bridewater (世界最大のヘッジファンド)

What Are We Writing?

先週は、以下の記事をTeam Exploratoryより出しました。

What Are We Working On?

Exploratory v5.0

次のExploratory v5.0では、新しいチャートのタイプがいくつか追加されます。そのうちの一つはタグ・クラウドというもので、よくテキストデータを可視化するために使われます。

以前、こちらの記事でもテキストデータをExploratoryの中でタグ・クラウドを使って可視化する方法を紹介しましたが、そのときは、NoteのなかでRのスクリプトを書く必要がありました。

v5.0からはその必要がなくなります!

Exploratory v4.4.0.4

現在、以下のバグ修正を含んだパッチセットを来週にリリースするための準備中です。他にも何か緊急な修正が必要な場合はご連絡ください。

  • Chart: Showing Empty Area when Month Name is assigned to X-Axis and Color By is used.
  • Chart: Month Name labels on X-Axis are not matching with what each bar represents.
  • Chart: Table properties are broken.
  • Chart: Chart gets refreshed every time hitting the enter key event to finalize Japanese words in the property.

市区町村地図

もともと用意してあった日本の市区町村の地図はもとになっていたデータが古かったため、一部の市町村が正しくが表示されないという問題がありました。そちらを修正してしたものを、マップ・ストアの方にリリースしましたので、必要な方は直接そちらよりインストール、もしくはアップデートしてみてください。アップデートの仕方はこちらに書いてあります。

Before:

After:

こちらに、「日本の市区町村の地図を使った可視化とデータの加工」というステップ・バイ・ステップでデータの加工と可視化を行っていく記事を以前書いてありますので、よろしければ参考にしてみて下さい。

次回データサイエンス・ブートキャンプ10月開催!

冒頭にも書きましたが、データサイエンス・ブートキャンプの次回の東京での開催は10月の中旬です。

すでに平日版はいっぱいとなってしまいましたが週末版はまだ数席空きがあります。データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方がいらっしゃいましたら、この機会にぜひご検討下さい!

詳細を見る


それでは、今週は以上です。素晴らしい一週間を!

西田, Exploratory/CEO
KanAugust(Twitter)


こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。