こんにちは、Exploratoryの西田です。

あけましておめでとうございます。

今年も、みなさまにとって役立つデータサイエンス分野の情報をどんどんと共有していければと思っています。引き続きよろしくお願いします!

いよいよ来週末より1月のブートキャンプが始まりますが、その次の3月のブートキャンプの受付もすでに開始しております。ビジネスでよりよい意思決定をしていくために必要なデータサイエンスの手法を、プログラミングなしで一から体系的に学びたい方は、この機会に参加をご検討ください!

ちなみに、早割のほうは来週の火曜日までとなっておりますので、興味のある方はお早めに!

詳細を見る

それでは、今週のWeekly Update、さっそくいってみましょう!

最近の興味深い英文の記事

AIはテック企業をさらに強くするのか

現在、AI分野で進んでいる企業と言えば、Google、Apple、Facebook、Teslaなどといったシリコンバレーの企業か、中国のいくつかの企業を思い浮かべる人も多いのではないでしょうか。

そういった企業はデータ・ネットワーク効果を利用して、現在もどんどんとデータを集め続け、それによって彼らのアルゴリズムの精度をどんどん上げていくことにより、さらにユーザーの数が増え、それによってさらにデータがもっと集まるという、競争上の好循環を作り出しています。

このデータ・ネットワーク効果によって、シリコンバレーに代表されるすでにAIの強いテック企業はさらに強くなるので、これからさらなるビジネスの一極集中が世界的な規模で進むのではないかと言われています。

しかし、将来はそんなに単純なのでしょうか。

この疑問に答えるために、A16Zというベンチャー・キャピタルの気鋭のアナリストであるBenedict Evansからの参考になる考察が出てましたので、こちらで紹介します。

続きを読む。

「データは真実」はほんとうか

最近、データを使うということが手段でなく、目的になってしまい、その挙げ句、データが「神格化」されてしまっているような風潮があります。

つまり、データが言うのだから、間違いはないというわけです。

そこで「データ・ドリブン」という言葉が先歩きをしてしまうのでしょう。

もちろん、単に「データ」と言っても、人によってその意味することは様々ですが、その中でも、英語では、「Raw Data」、日本語にすると「生データ」、つまり加工する前の、とれたてほやほやのデータという意味でのデータは、人間によって操作されていないので、事実で、客観的で、正直だと私達は思い込んでいたりします。

しかし、そういった期待は全くの勘違いで、データとは集められた瞬間からすでに人間の意思によって「汚れている」ものなのだという記事がおもしろかったので、こちらで紹介したいと思います。

続きを読む。

アメリカ政府はすべてのデータをオープンにするのが当たり前になる

Congress votes to make open government data the default in the United States - Link

去年のクリスマス直前に、アメリカの議会は、連邦政府の全てのデータをデフォルトでオープンにするという法案を通しました。

もちろん、例外はあるようですが、それでもこうしてデータをオープンにすることがデフォルト。つまり特別なことがない限りはオープンにすることが前提というのは、大きなステップだと思います。

前オバマ政権のときには、Data.govといったサイトを作って全省庁にデータを共有するイニシアティブを行っていましたが、今回の決定はそれよりも大きく、法による強制力があります。

さらに、マシンが読める形で公開するとあり、XML、JSON、CSVといったものを想定しています。もちろん単純にスキャンしたものではだめですし、PDFやWordといった人間が読めるがマシンに処理させるのには適していないフォーマットもだめです。

日本の場合は公開されているデータが少ない、あっても見つけにくい、見つけられてもフォーマットがむちゃくちゃで使いにくい、といったかんじですので、ぜひ積極的に改善していってほしいものです。

もちろん、データをオープンにすることで、市民が何かおもしろいインサイトを発見したり、おもしろいサービスを作ることができる、といった期待もあります。しかし、それ以上に、私が個人的に期待するのは政府が集めているデータというのはクオリティーが高く、やはり政府にしか集めることができないものもたくさんあります。そういったデータにビジネスが簡単にアクセスし、使えるようになると、日本の企業の生産性がもっと上がると思うのです。

さらにもっと多くのビジネスに使われることによって、フィードバックも増え、それをもとにデータ収集の仕方がさらに改善されていけば素晴らしいですよね。


Quote of the Week

“All models are wrong, but some models are useful.” 

全てのモデルは間違っている。それでも、役に立つモデルも中にはある。

by George E. P. Box、 統計学者


What Are We Writing?

最近、英語なのですが、以下のHowToを書きました。医療系で研究されてる方には役立つかもしれません。興味のある方はどうぞ!

How to Create Table 1 Summary Information - Link


What Are We Working On?

Exploratory v5.1

いよいよv5.1のリリースが近づいてきました。先週は、スケーラビリティ、エラー処理、バグの修正などを外から見えにくい仕事ばっかりやっていました。(笑)

データサイエンス・ブートキャンプ、3月開催!

冒頭でも触れましたが、次回の3月のブートキャンプの募集を開始しました。早割のほうは来週の火曜日までとなっておりますので、データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方は、ぜひこの機会に!

詳細を見る


それでは、今週は以上です。素晴らしい一週間を!

西田, Exploratory/CEO
KanAugust(Twitter)


こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。