こんにちは、Exploratoryの西田です!

先週お伝えした、アメリカでのオピオイド中毒は全国的な現象ですが、その中でも一部のバーモントやウェストバージニアといった州ではその深刻化が他に比べて圧倒的に悪いです。

実は日経BPの篠原さんが去年この件についてウェストバージニアやケンタッキーなどの現場に行き、多くの人たちへのインタビューをもとにしたルポをこちらに書いていました。さすがですね。様々な視点を織り交ぜ、深く切込んだ記事となっていますので、興味のある方はぜひ読んでいただければと思います。悲しい現在進行系の話でもあるので、ハンカチが必要となります。

もともとウェストバージニアやケンタッキーでの中毒者の増加は石炭産業の衰退が原因ではないかと教えていただいたのが、この記事を知るきっかけとなったのですが、それではその影響はどれくらいのものだったのかと、石炭産業の雇用データを可視化したものをこちらにまとめてみました。

データ・ラングリング(加工)の仕方も後半に書いてありますので、興味のある方は是非参考にしてみてください。(英語ですが。。。)

それでは、さっそく今週のWeekly Updateの方いってみましょう。

最近の興味深い英文の記事

パワーユーザー・カーブ

パワーユーザーというのは、頻繁にあるプロダクトを使うユーザーのことです。そして、パワーユーザーがいるということはそのプロダクトに何かユーザーを夢中にさせるものがある、ユーザーが頻繁に出くわす問題を解決してくれている、日々の仕事を効率化してくれているということです。

今回は、A16Z(Andreessen Horowitz)Andrew Chenが、彼のチームが投資先を分析するときによく使うパワーユーザー・カーブというフレームワークの説明をしていたので簡単に紹介したいと思います。A16Zといは、こちらシリコンバレーではトップ5に入る比較的若手のベンチャー・キャピタルで、彼は現在そこのパートナーです。その前はUberでグロースをやっていた人です。

続きは、こちらからどうぞ!

私達、Exploratoryのパワーユーザー・カーブ分析も最後にのせてあります!

アメリカのロビー業界もAI・データの時代

Tim Hwang’s FiscalNote is revolutionizing Washington lobbying with big data - Link

アメリカでは政治の世界は、様々な業界、権益の声を政治に反映させるためのロビイストなしでは語ることができません。もちろん、これはアメリカの国内だけの話ではなく、日本の政治、企業もこうしたロビイストたちを使って、国やビジネスの利益を守るための活動をワシントンDCでしているわけです。

今回は、このロビー業界にもAIとデータの波が来ていて、ロビー活動の仕方が変わってきているという話を紹介したいと思います。記事自体はそうした変革の中心となっているFiscalNoteというプロダクトのPRに近いものがありますが、それを差し引いても、この業界でAIとデータを使うとはどういうことなのかを垣間見ることができると思います。

以下、要訳。


FiscalNoteを使うと、クリックするだけで法案のテキストがそれを支援している政治家の名前と一緒にでてきます。さらにその法案をクリックするとその法案に関して知りたい情報がまとめられたものが出てきます。そこには法案を通すことができる政治家、法案を葬ることが出来る政治家、彼らの今までの投票記録、どれだけの頻度でそれぞれの政治家が支援した法案が通っているのか、それぞれのトピック(ヘルスケア、教育、住宅)に対する法案を通すことができる効率性や彼らの政治的なポジション、などです。

さらに、自分の興味のある法案に対して、それぞれの政治家がどう投票するのかをデータをもとに予測することができます。

ロビーストのZoldakは言います。

「この情報がどの地域に私達の努力を傾けるべきかを明らかにしてくれます。」

FiscalNoteは政治の世界のMoneyball(ベースボールにデータを持ち込んだことで有名になったオークランドのコーチの実話に基づく映画)のようなものです。ベースボールがそうであったように、ロビー活動の世界も、年季の入った人達による勘と経験がものをいっていた世界から、データとAIによる予測がものをいう世界へとなりつつあります。

FiscalNoteのファウンダーのTim Hwangはもともとオバマの選挙キャンペーンに15歳の時にボランティアとして関わり始めたのがデータの世界に入り始めたきっかけです。

「オバマの選挙キャンペーンはスタートアップ志向で、とても分権的で、とても指標重視の文化を持っていました。私達はどのように現場のデータを使って日々のリソースを効率良く使えるかをいつも考えていました。」

HwangはFiscalNoteを使って政府系のデータを整理することで企業、組織、そしてロビイストたちが新しい法律や規制が彼らにとって何を意味するのかをより正確に予測するのに役立てたいと思っています。例えば、マクドナルドの弁護士は新しい法律や規制が出てくるたびに、それが彼らの業界にとってどのようなインパクトをもつのかを理解するために使っています。

FiscalNoteは何百もの政府関連のウェブサイト、Congressional Budget Office and the Congressional Research Service、規制当局、政治家の投票履歴、といった様々なデータソースをうまく混ぜ合わます。46人いる研究と開発のチームはウェブのデータをスクレイプし、インポートし、整理し、後でテキストデータとして検索しやすいように構造化する作業を毎日のように行っています。そのスケールはすさまじいです。連絡先の情報だけで、78,000人にも登る世界中の政治家、22カ国からの公共政策のドキュメント、過去110年にも遡るアメリカの全ての規制当局からの全ての規制などといったかんじです。

トヨタのような民間企業から、American Society for the Prevention of Cruelty to Animalsのような動物愛護団体まで、一年当たり1万ドルから数十万ドルほどのお金を費やしています。FiscalNoteを使えば、法案が通るか通らないかの確率がわかるからです。それまでの法案を通してきた履歴、法案の党派色、さらに彼らが支援した法案は法律を変えようとするものなのか、それともただの宣言のような何の実質的な効果のないものなのかということから、それぞれの政治家がどれだけ効率的なのかということもわかります。

政府のデータをもっとオープンにアクセスできるようにするためのデータ・コアリションというロビー団体の政策ディレクターをつとめるChristian Hoehnerによると、

「FiscalNoteを使って、キーとなる政治家を見つけ出し、法案をモニターし、アラートを設定するだけでいい。」

とのことです。

オライリーの機械学習に関するアンケート調査からわかった5つのこと

5 findings from O’Reilly’s machine learning adoption survey companies should know - リンク

テック系の本の出版やイベントを行っているO’Reillyという会社が世界中の11,000名のデータに関する専門家(データサイエンティスト、MLエンジニア)を対象に彼らの所属する組織の機械学習に対する取り組みに対するアンケート調査を公表しています。詳しい内容はこちらのレポートにまとめられていますが、以下がハイライトです。

  • 40%の人たちは彼らの所属する組織はモデルの公平性、バイアスを評価する仕組みを持っている。
  • 51%は内部のデータサイエンスチームが自分たちで機械学習のモデルを作っている。
  • クラウド企業(Googleなど)が提供するAutoML(自動機械学習)のサービスを使っているところは1桁(パーセント)台。
  • この分野の経験のない企業は外部のコンサルタントに頼る傾向があるようです。
  • 慣れているチームはデータサイエンスチームがチームのプライオリティを決め、プロジェクトの成功を図るための鍵となる指標を決めている。一般的にはプロダクト・マネージャーが行っている。

Quote of the Week

Sometimes, what you’re looking for is already there. //Aretha Franklin

時々、あなたが探しているというものはすでにそこにあったりするものよ。

アレサ・フランクリン

R.I.P. Aretha Franklin…

What Are We Writing?

先週は、以下の記事をTeam Exploratoryより出しました。

What Are We Working On?

Exploratory v5.0

次のExploratory v5.0では、いくつか新しいチャートタイプが入ってきますが、既存のものに対しても、いろいろと機能強化が入ってきます。そのうちの一つが、ラインチャートで時系列データを可視化するときに便利な、日時のレンジ(範囲)スライダーです。

Exploratory v4.4.0.5

先週のアップデートでもお伝えしましたが、先週パッチとして、Exploratory v4.4.0.5をリリースしています。

ダッシュボード、ノート、スライドを使っている方で、まだアップグレードされていない方は、ぜひこちらよりダウンロードして、アップグレードしてください。このあたりの重要なバグの修正が入っています。

他にも多くのバグの修正がありますが、こちらのリリースノートに詳しい情報があります。

次回データサイエンス・ブートキャンプ10月開催!

データサイエンス・ブートキャンプの次回の東京での開催は10月の中旬です。

すでに平日版はいっぱいとなってしまいましたが週末版はまだ数席空きがあります。データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方がいらっしゃいましたら、この機会にぜひご検討下さい!

詳細を見る


それでは、今週は以上です。素晴らしい一週間を!

西田, Exploratory/CEO
KanAugust(Twitter)


こちらのExploratory’s Weekly UpdateはExploratoryのユーザー以外の方も無料で購読できます。まだEmailを登録されていない方はこちら よりどうぞ!皆さんのお役に立つと思うデータサイエンス関連のニュースをまとめたものを週一度配信いたします。