こんにちは、Exploratoryの西田です!
ここアメリカでは現在オピオイド中毒が全国的な社会現象になっています。
実はこのオピオイド、入手が比較的簡単で、病院でオキシコドンという痛み止めとして処方されています。
私も2012年の秋に自転車でクラッシュしたときに足の骨を折って病院で手術したときに、手術後の痛み止めとしてオキシコドンを3週間分ほど処方されました。こちらでは普通に手に入る薬です。
ところが、これに中毒になってしまい、地下でもっと安く手に入るヘロインなどに手を出してしまったり、さらに過剰摂取で死んでしまったりという人が、特にこの20年ほどの間にものすごい勢いでアメリカ中で増えています。
先週のアメリカ政府機関のCDC (Center for Disease Control and Prevention) からの発表によると、このオピオイド中毒になったお母さんから生まれてくる子供の数が1999から比べると平均して40倍も増え、一部の州では100倍というとんでもない割合で増えていっているということです。ある州では20人に1人の赤ちゃんが生まれながらにオピオイド中毒とのことです。これが今のアメリカです。
その蔓延のスピード、さらに地域による差をより理解したいと思ったので、そこで発表されていたデータをとってきて可視化してみました。
英語ですがもしよかったらぜひ見てみてください。とても悲しくなるデータです。
それでは、さっそく今週のWeekly Updateの方いってみましょう。
https://qiita.com/KanNishida/items/444fa8ee35e3c0208dce
実は今月、8月でちょうどRが生誕25年になります。🎉🎉🎉
こんなに年月の経った今でも、その進化はとどまることを知らず、そのスピードはさらに加速しています。Rはオープンソースのデータ分析ソフトウェアなので、典型的な商用ソフトのように大きなマーケティングや営業部隊がいるわけではないので、世の中への浸透度というものが一般の人にとってはつかみにくいものがあります。例えば、RのテレビCMなんてありえないでしょう。(笑)
しかし、直接的、間接的に世の中へ与えたインパクトという意味では、計り知れないほど大きいのではないでしょうか。かくいう私も、Rによって人生が変わってしまい、おかげでExploratoryという会社まで作ってしまいました。(笑)
そこで、そのRの25周年を記念した、「R Generation: 25 Years of R」という記事が最近出ていたので、こちらで紹介したいと思います。Rの歴史、コミュニティ、文化、将来に関する話です。
続きはこちらからどうぞ!
What Machine Learning Can and Cannot Do - リンク
タイトルのとおり、機械学習に何ができて、何ができないのかについてうまく8つにまとめられている記事がありました。どれも重要なポイントではありますが、その中でも特に重要でついつい見逃しがちな2つの点を以下に上げておきます。
明確なゴールと指標
機械学習によるソリューションはそれが達成しようとするゴールを明確に定義できているときに成功します。例え、そうしたゴールを達成するための最適なプロセスがはっきりと定義されていなかったとしてもです。例えば、ビデオゲームでの得点、町の中の車の流れの最適化など、そうしたゴールが指標としてシステム的にはっきりと定義されているときに力を発揮します。
現象の変化と再トレーニング
機械学習によって学ばれた現象やルールは時間がたつに連れ頻繁に変わるべきではありません。一般的に機械学習のアルゴリズムがうまく機能するのは、将来のデータとトレーニングに使った過去のデータの分布が似通っているときです。もし現象やルールが時間とともに変わっていくのであれば、機械学習のモデルを絶えずトレーニングし続ける必要があります。
さらに、以下の記述が興味深いです。
1980年以来、アメリカでの雇用の機会は極端に2極化しました。いわゆるブルーカラーとよばれる同じことを繰り返すことが多い非熟練の仕事と、ホワイトカラーと呼ばれる知的能力を要する仕事の両方が減少していっています。というのもそれらは自動化と低賃金の国へのアウトソースによって置き換えられる仕事だからです。
それと同時に、料理のサービス、清掃サービス、パーソナルケア、ヘルスケア、といった、低いスキルしか要求されないが単純な繰り返しが少ない仕事と、マネージメント、コンサルティング、テックといった高いレベルの知的能力が要求される仕事に関してはどんどんと増えていっています。
どうも、AIによる自動化と言うと、低スキルの単純な仕事が消えて、いわゆる知的な高スキルな仕事が残ると思われがちですが、そういう区切りではなく、むしろ単純な繰り返しの多い仕事というのがAIによる自動化によって置き換わっていくのであって、そういった仕事というのは低スキルな仕事でも知的な仕事でも、たくさんあるのです。逆に、その両方のタイプでも仕事が増えているものがあるというのは、おもしろいですね。
普段から自分の仕事が何であれ、規則的な繰り返しが多いなと思ったら気をつけたほうがいいですね。ちなみに、
“No one believes an hypothesis except its originator but everyone believes an experiment except the experimenter.”
仮説とは、それを作り出した人以外は誰も信じないものだ。逆に、実験とはその実験を行ったもの以外のみんなが信じるものだ。
W. I. B. Beveridge (The Art of Scientific Investigation)
先週は、以下の記事をTeam Exploratoryより出しました。
次のExploratory v5.0では、いくつか新しいアナリティクスが追加されますが、そのうちの一つはマーケット・バスケット分析(アソシエーション・ルール)です。
よくある、オムツを買う人はビールも一緒に買う人が多いといったルールをデータから見つけ出してくれるアルゴリズムです。
例えば、上のネットワーク・チャートの矢印が指しているルールでは、Tropical FruitとCurdという食品を買う人はWhole Milk(牛乳)を買うことが多いということを示しています。
以前、こちらの記事で、マーケット・バスケット分析の結果をNoteのなかでRのスクリプトを書いて、上記のようなチャートで表現する方法を紹介しているのですが、v5.0からはアナリティクス・ビューの下でボタンを押すだけで簡単に計算をして可視化することが出来るようになります!
ダッシュボード、ノート、スライドに関するバグが見つかったので、その修正のために緊急にパッチをリリースすることになりました。
こちらが、このエリアに関連する2つのバグです。
このタイミングで以下のエンハンスメントも入れています。
後、日本語環境で使っている場合は、以下のバグの修正が役立つかもしれません。
他にも多くのバグの修正が入っていますが、こちらのリリースノートに全てのバグの修正の情報があります。
ご面倒おかけしますが、ぜひ最新版をダウンロードしてみてください。
データサイエンス・ブートキャンプの次回の東京での開催は10月の中旬です。
すでに平日版はいっぱいとなってしまいましたが週末版はまだ数席空きがあります。データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方がいらっしゃいましたら、この機会にぜひご検討下さい!
それでは、今週は以上です。素晴らしい一週間を!
西田, Exploratory/CEO
KanAugust(Twitter)
こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。