こんにちは、Exploratoryの西田です。
まず最初に3点ほど。
まずは、探索的データ分析を実際にやりながらオンラインで学んでいく場としてEDAサロンというのをやっていますが、先日、先月8月のEDAサロンに参加していただいた方達による発表会をオンラインでやりました。録画の方がありますので、興味のある方はぜひチェックしてみて下さい。
詳細はこちらにあります。
次に、毎週木曜日にやっているオンラインセミナーですが、今週は主成分分析(PCA)の紹介をしました。変数間の関係を可視化したい時にも使える便利なアルゴリズムです。参加できなかった方はぜひ録画の方をチェックしてみて下さい。
最後に、毎回好評いただいているデータサイエンス・ブートキャンプですが、次回の開催は11月です。
データサイエンスを1から体系的にプログラミングなしで学びたいという方がまわりにいらしたら、ぜひご紹介していただければと思っております。
それでは、今週のWeekly Update、さっそくいってみましょう!
データサイエンスという言葉は誰がつけたのか、どのように始まったのかと言う話をする時、よく話題になるのが、2012年にFacebookでデータを使ってグロースをやっていた Jeff Hammerbacher と、当時はLinkedInでデータ分析の仕事をしていたDJ Patilの間での議論から生まれたきたと言うのがあります。(リンク)
しかし実はその10年前となる2001年にベル研究所のWilliam (Bill) Clevelandが、「Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics」というレポートの中で、それまでの統計学と当時すでにどんどんと進化していたコンピューターによるデータの処理技術を合わせたものとしてデータサイエンスという、一つの独立した学問の分野を提唱しています。
この中でデータサイエンスの学問に必要となる以下の6つの領域を提案しているのですが、それから20年近く経つ今となっても重要で、いろいろと考えさせられることが書かれているので、今さらですがここで皆さんと共有したいと思います。
ちょっと前にイーロン・マスク(Tesla、SpaceX、Boring、Neural Link)とジャック・マー(アリババ)の二人による対談があり、その様子を収めたビデオがアップされていました。
その中でAIに関する議論があったのですが、2人は全く違う視点を持っていておもしろかったです。
マスクはAIは人間にとって脅威であるという立場の人で、逆にジャック・マーは脅威にはならないという立場の人です。
マスクは自分が関わっているTesla、SpaceX、Neural Linkといった会社でも最先端のAIを研究し実際に使っている「現場」の人ですし、さらにこれまでも誰もが無理だと思うような大風呂敷を広げてはそれをやり遂げてきた有言実行の人なので、彼が「AIは人間にとって脅威となりうる」と言うときには、真剣に耳を傾けるべきだと思います。
そこで、AIに関する議論の部分だけをハイライトとして紹介したいと思います。
データサイエンティストの給料は高い!というのはこれまでも何度か紹介してきたと思いますが、最近Tony Yiuというデータサイエンティストが、アメリカのH1Bという労働ビザに関するデータを使って、アメリカの企業でデータサイエンティストとして仕事をしている人たちの給料を調べたものを公開してたので、ここで簡単に紹介します。
Team Exploratoryの村里によるSaaSアナリティクスのシリーズです。
今回はSaaSのビジネスの成長にとって理解しておくべき指標の選択について、多数のグローバルSaaS企業のエグゼクティブからのコメントをもとにまとめています。
“There’s a big difference between knowing the name of something and knowing something.”
何かの名前を知っているということと、そのことを知っているということには大きな違いがある。
リチャード・ファインマン
Exploratory v5.3.2パッチ、出ました!🎉
予想以上に時間がかかってしまいましたが、結構な数の機能強化とバグの修正を詰め込み切ることができました。
こちらに英語となりますが、詳細のリリースノートがあるので興味のある人は見てみて下さい。
最新版のダウンロードはこちらからとなります!
インストール周りにはかなりの改善が入っているのでもし昔インストールに失敗したことのある人はぜひ試してみて下さい!
こちらは、私達のクラウド・サーバーであるexploratory.ioを使う代わりに、自前のサーバーでExploratoryで作ったダッシュボードやチャート、データなどを共有し、さらにスケジュールしたり、パラメーターを使ってインタラクティブに運用したいという方たち向けのオンプレミスの製品です。
こちらの方も、最新のExploratory v5.3.2対応となりリリースされました!🎉
無料で30日間試すことができます。ダウンロードはこちらからとなっております。
毎週火曜日のお昼12時はExploratoryアワーです。
Exploratoryのユーザーの方からいただいた、データに関する質問にライブデモを通して答えています。
今週は、以下の2つの質問に答えました。
詳細や過去の録画はこちらのページにあります。
今週は、主成分分析(PCA)の紹介と使い方の話をしました。
変数同士の相関、さらにそれらがどのように観察対象と関係を持っているかを可視化したいと言った時に便利なアルゴリズムです。
セッションの録画とスライドはオンライン・セミナーのページにアップしてあります。
毎回好評をいただいているデータサイエンス・ブートキャンプですが、次回は11月です!
データサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使えるようになりたいという方は、ぜひこの機会に参加をご検討ください!
それでは、今週は以上です。素晴らしい一週間を!
西田, Exploratory/CEO
KanAugust(Twitter)
こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。