こんにちは、Exploratoryの西田です。
いよいよ、令和ですね!🎉
私はこの「令和」に関するストーリーが大好きです。
今からおよそ1200年前に遡ることができるなんて、USにいると余計に凄さと重みを感じます。そして何より、新しい時代が来たんだなと、ものすごく興奮してしまいますね。
ところで、今回でこのWeekly Update50回目になります!🍾
正直言って最初はこんなに続くとは思っていませんでした。(笑) これまで、お付き合いしていただきどうもありがとうございました!
「データ関連で面白くて役に立ちそう」という観点で、皆さんにぜひ知ってもらいたい英文の記事を探してきて、翻訳したりまとめたりして、さらにコメントや解説を付けるということを繰り返してきましたが、そうしたことをほぼ毎週(日本でのブートキャンプのときは休みですが。。。😅)繰り返してきたことによって、実は自分にとってもものすごく勉強になったなとかんじています。
翻訳や要訳をするためには、実は少なくとも5回ほどは読み直していたりします。今週のテューキーの難解な文章は10回くらい読み直していると思います。(こんな暇なCEOがいていいんでしょうか。😆)これによって、写経ではないですが、もとの記事の著者が言わんとしていることが自分の肉になるようなかんじです。
みなさんもよかったらやってみてください!
これからもみなさんのお役に立てるよう、クオリティの高いデータ関連の英文の記事やエッセイを見つけて共有していきたいと思いますので、引き続きよろしくおねがいします。
また、周りにデータに興味のある方がいらしたら、ぜひこちらのメールをフォワードして紹介していただければと思います。購読は無料です!
最後に、現在以下の3つのデータサイエンス・トレーニングの参加者を受付中です。興味のある方はこの機会に参加をご検討ください!
それでは、今週のWeekly Update、さっそくいってみましょう!
これまでにも何度か紹介してきた、シリコンバレーのA16Zというトップクラスのベンチャーキャピタルの気鋭のアナリスト、ベネディクト・エバンスが、「AIのバイアス」についての考察をまとめていました。
いわゆる「AIのバイアス」といえば、例えば、白人の方が黒人より多い画像データで作ったAIシステムは白人を認識するのは得意だが黒人はそうでない、といったもののように、私達にとって想像つきやすいものについつい目が行ってしまいがちです。しかし実は、私達人間には認識すらできないもの、例えば光の当たり加減や、音の領域などがバイアスとしてデータに入ってきてしまった場合におきるAIのバイアスこそが、難しい問題なのではないかとベネディクトは言います。
いつものように、鋭い考察でいろいろな角度からAIのバイアスに切り込んでいきますが、彼のエッセイがおもしろいのは、もちろん彼の分析力、クリティカル・シンキング能力が素晴らしいからというのもありますが、それと同時に「たとえ」を使うのがうまいというのが大きいと思います。
今回も洗濯機や麻薬探知犬などわかりやすい「たとえ」が出てきます。
先週、テューキーの「The Future of Data Analysis」というエッセイに対する考察について紹介しました。
「The Future of Data Analysis」の中でテューキーが言わんとしているのは、データ分析とはより良い質問を作り出していくことだ、ということでした。
この「The Future of Data Analysis」というエッセイが出版されたのは1961年、今からおよそ60年前のことですが、彼がこのエッセイの中で伝えようとしていたことは今日になっても色あせることがありません。
むしろ、現在データサイエンスの世界で起きている多くの議論というのはすでにこのエッセイの中に見つけることができます。
例えば、統計的に有意かどうかの判断が5%なのか1%なのかといった議論に時間を掛けるのが無駄だとか、そもそもそういった仮説検定の手法やその正しさを議論することに時間をかけるよりも、データから仮説そのものを構築していくことにもっと時間をかけるべきだとか、「最適化(モデルの予測精度を上げる)」に時間を使うよりも、よりよい質問を探すことに時間をかけるべきだ、といった今日のデータサイエンスの世界に生きる私達にとっては耳が痛いものばかりです。
「真理」というのは時代を超えて生き残っていくのだなと、改めて感心してしまいます。
そして、今日データ分析に関わるものであれば誰でも、賛成する賛成しないに関わらず、このテューキーの教えを知っておいて損はないと思います。
とういうことで、「The Future of Data Analysis」の中でテューキーが述べていることの一部を、何回かに分けて紹介していきたいと思います。
今回はそのエッセイの中の「データ分析にどういう態度で臨むべきなのか」という章を紹介します。
“the important and difficult job is never to find the right answer, it is to find the right question. for there are few things as useless ( if not as dangerous ) as the right answer to the wrong question.”
重要なことは、正しい答えを見つけることではなく、正しい質問を探すことである。間違った質問に対する正しい答えほど、役に立たないものはない。むしろそれは危険ですらある。。
by ピーター・ドラッカー
Team ExploratoryのIkuyaからのSaaS・サブスクリプションビジネスのためのアナリティクス・シリーズです!
Exploratory Collaboration Server v5.1が今週リリースの予定です。
これは、私達のクラウドにパブリッシュするかわりに、自分たちでサーバーを立てて(オンプレミス)、そこでダッシュボードやデータなどの共有、スケジュール、そしてv5.1からの機能であるパラメーターを使ったインタラクティブ・ダッシュボード(またはレポーティング)をしたいという人たち向けの製品です。
興味があってもっと詳しく知りたいという方は、お気軽にご連絡ください!
パフォーマンス
先週はチャートやデータラングリングまわりのパフォーマンスの改善をやっていました。チャート間を行き来するときや、データラングリングのスッテプを追加するときなどの動きがもっとスムースになります!
バブル・チャート
こちらのチャートの機能強化を行っていました。バブル・チャートに散布図と同じレベルの機能を追加しています。
負の二項分布
GLMの方に、新しく「負の二項分布」が付け加わります!
この5月には以下の2つの新しいトレーニングを開催します!
SaaS/サブスクリプション・ビジネスを改善していくためのKPIの構築から、データサイエンスの手法を使ったデータ分析、施策立案までのスキルを身につけていただくことを目的としたトレーニングです。
5月20日 (月)です!
ビジネスの問題を解決するための仮説をデータから構築していく「探索的データ分析」の手法と、そうした分析に役立つ様々なチャートとアナリティクスの効率的な使い方を身につけていただくためのトレーニングです。
5月27日 (月) です!
毎回好評をいただいているデータサイエンス・ブートキャンプですが、次の開催は7月です!
データサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使えるようになりたいという方は、ぜひこの機会に参加をご検討ください!
それでは、今週は以上です。素晴らしい一週間を!
西田, Exploratory/CEO
KanAugust(Twitter)
こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。