Photo by rawpixel on Unsplash

あなたのデータサイエンス本気度を試す4つの質問

データサイエンスという言葉はまだ流行っていますが、ひょっとしたらあなたの組織にとっては必要ないかもしれません。

この重要な問いに答るためにはまず、そもそもデータサイエンスの目的とは何なのか、どういった組織がデータサイエンスをやるにふさわしいのかを理解する必要があります。

この点についてうまくまとめられている記事が、シリコンバレーのInstacartで、データサイエンスのVP(バイス・プレジデント、日本で言う部長)をやっているJeremy Stanleyと、元LinkedInのデータリーダーで今はテクニカル・アドバイザーをやっているDaniel Tunkelangによって最近出されていたので、ここで紹介したいと思います。


Doing Data Science Right — Your Most Common Questions Answered - Link

データサイエンスの目的

データサイエンスにはどちらも重要だが大きく異なる2つの目的があります。一つはあなたのカスタマーが使うことになるプロダクトを改善するためで、ここではこれをデータプロダクトとよびます。もう一つはあなたのビジネスが行う意思決定を改善するためで、ここでは意思決定サイエンスとよびます。

データプロダクトはデータサイエンスとエンジニアリングを使ってプロダクトの性能を改善させます。例えば、検索、レコメンデーション、意思決定の自動化などです。

意思決定サイエンス(ディシジョン・サイエンス)はデータを使って例えば成長、エンゲージメント、利益率に関連するもの、ユーザーからのフィードバック、などといったビジネスの指標を分析し、戦略や重要な意思決定にとって必要なインサイトを提供します。

意思決定のためのデータサイエンス

意思決定サイエンスはデータを分析したり可視化したりすることでビジネスやプロダクトに関する意思決定をサポートします。意思決定者は組織のあらゆるところにいます。プロダクト・マネージャーはプロダクト・ロードマップの優先順位を決めるために意思決定を行い、重役はビジネスの戦略的な意思決定を行うといったぐあいです。

意思決定サイエンスが解決を求められる問題は多くの場合難しいものです。これまでに経験したことのない新しい問題であることが多く、データサイエンティストは未知の変数や足りない情報に対処しなくてはなりません。またそうした問題は複雑で、多くの要素が絡み合うのでその裏にある因果関係を理解するのが難しいのです。それでも、意思決定サイエンスの問題は計測することができるもので、この手の仕事がビジネスに与える影響は大きく確かなものです。

意思決定サイエンスとはデータ・アナリティクスと同じようなものだと感じるかもしれません。実際、データ・アナリティクスと意思決定サイエンスの違いははっきりしていません。しかしそれでも、意思決定サイエンスはレポートやダッシュボードを作る以上のものなのです。データサイエンティストはBIツールでできるような仕事をしているべきではないということです。

LinkedInではエグゼクティブチームは意思決定サイエンスを使ってユーザーのプロファイルがどのように検索結果に表示されるべきかに関する重要なビジネスの意思決定を行いました。

歴史的には有料のユーザーのみが、自分のネットワークの中にいる人達のプロファイル情報の全てに目を通すことができていました。この表示に関するルールは複雑で、私達はユーザーにとってもっとシンプルなものにしたいと思っていたのですが、それと同時に収益を減らすという事態にはしたくないという思いもありました。

そこで意思決定サイエンスにより提案されたモデルは、無料ユーザーに月に見ることができる量の制限をつけるというものでした。意思決定サイエンティストは過去の行動様式に関するデータをもとに、この変更が収入とユーザーのエンゲージメントに与えるインパクトを予測しました。この分析は過去の行動パターンから、将来の全く違う行動パターンを理解するための推測をしなくてはいけませんでした。

結果はビジネスにとってポジティブだっただけでなく、何百万というユーザーにとってのユーザー体験の向上につながることになり、プロダクト開発にとって大変だった複雑さを取り除くことにもなりました。

意思決定サイエンスとデータプロダクトは同じようなスキルを要求しますが、2つの分野で同時に優れているデータサイエンティストはなかなかいません。意思決定サイエンスはビジネスとプロダクトに対する理解、システム思考、高いコミュニケーション能力を要求します。データプロダクトは機械学習の知識とプロダクションレベルのエンジニアリングのスキルを要求します。

もしあなたのデータサイエンスチームが小さければ、2つの領域が得意なほとんどいないスーパースターのような人たちを見つける必要があるかもしれません。しかし、ふつうはそれぞれの領域に特化した人たちを雇い、育てていくことがチームをスケールさせる上で重要になります。

データサイエンスが必要かどうかチェックする4つの質問

データサイエンスのチームを作る前に以下の4つの質問に答えるべきです。

1. ビジネスの戦略的な意思決定をサポートする、またはデータプロダクトを作るためにデータサイエンスを使う、ということにコミットできるか

もしこのどちらかに関してコミットできないのであれば、データサイエンティストを雇うべきではありません。

彼らは戦略的な意思決定をサポートすることができますが、それはあなたがデータを使って意思決定をするという文化を組織内に作るということにコミットできている場合のよってのみ可能です。

最初の頃は彼らを必要としないかもしれません。しかし、必要な人材をを雇うのには時間がかかります。そして彼らがあなたのデータとあなたのビジネスを理解するのにも時間がかかるものなのです。こうした理解抜きには、データサイエンティストには意思決定に影響を与えるレベルの仕事を行うことはできません。

2. 必要なデータを収集して、データ分析の結果をもとに行動することができるか

スタートアップの創業者であるエンジニアはMVP(Minimum Viable Product/価値を提供できる最小限のプロダクト)のプロダクトを少しのプロダクトとデザインに関するガイダンスをもとに作ることができます。

それに対して、データサイエンスはデータを必要とします。そしてそれは、モニターし、さらにスケールさせていく必要があるものなのです。レコメンデーション・システムを構築するためにはプロダクトがユーザーの行動をモニターする必要があります。ビジネスの意思決定の最適化のためには重要な施策とその結果に関する細かい指標が必要になります。

データはプロダクトの変更をインフォームし、組織のKPI(key performance indicators)をドライブするべきなのです。

データによる意思決定はCEOから始まるトップダウンでのコミットメントを要求します。

3. 意味のあるインサイトを得るための十分なシグナルがデータにあるか

多くの人がビッグデータとデータサイエンスをいっしょのことだと思っています。データサイエンスとはデータのほとんどを占めるノイズ(意味のないもの、がらくた)からシグナル(意味のあるもの、ダイアモンドの原石)を見極めることなのです。シグナルの量はデータの量に比例するわけではありません。シグナルとノイズの割合が重要なのです。

例えば広告のプロダクトは何千万というインプレッションのイベントに関するデータを収集するかもしれません。しかしここで言うシグナルは、ユーザーが広告をクリックするという、稀少なイベントのことになります。どんなにデータが大きくてもシグナルの量は小さいもので、このことはデータサイエンスの力を使っても変わるものではありません。

4. データサイエンスをコア・コンピテンシー(コアとなる競争力)にしたいのか、それとも外注でいいのか。

データサイエンス・チームを作るのは大変でお金がかかります。もし外注ですむのであれば、そうするべきでしょう。一つのやりかたはコンサルタントを注意を払いながら使うことです。しかしそれよりもいいのは、あなたのドメインに関してのクラウドサービスを使うことです。こうしたサービスは、データを渡すとモデルを作ってくれて、アクションを自動化してくれたり、レポートを作ってくれたりするものです。こうしたソリューションはあなたのビジネスの要求に完全に合ったものではないかもしれませんが、ビジネスの成長をさせていくためにはそうした妥協を必要とする場合もあります。それによって、あなたのコアチームがもっと価値を提供できることにフォーカスできるのであればなおさらです。

それでは、いつデータサイエンスがあなたのビジネスにとってコア・コンピテンシーになるべきなのでしょうか。

データサイエンスがあなたのビジネスの成功にとって重要な問題を解決しているのであれば、それを外注するなんてありえないことです。また、パッケージされたソリューションは融通がききません。もしあなたのビジネスがユニークなアプローチを取って問題を解決しているのであれば、例えば新しいタイプのデータを収集したり、分析結果を今までにないような形で使っていたりといった場合、パッケージ化されたサービスでは柔軟に対応できません。


以上、要訳終わり。

あとがき

本文の中で出てきた、データサイエンスが必要かどうかを判断するための4つの質問の最後、「データサイエンスをコア・コンピテンシー(コアとなる競争力)にしたいのか、それとも外注でいいのか。」という問いかけは、今全ての日本企業にとって重要だと思います。

なぜか、特に日本の企業ではデータサイエンスどころかデータ分析までも外注にしてしまっていることころをよく見受けます。

意思決定であれ、サービスの機能であれ、これからの時代、データをコアにしないビジネスなどというのは考えられません。このビジネスにとって戦略的に重要な機能を外注し、それで済ませることができると思っているのであれば、それはナイーブで、危機感の欠如のシグナルであると思います。

もちろん、最初の段階ではまずは外からプロを連れてきて助けてもらうというのはありだと思います。しかし、そのときには、長期的な視点で今後どのように、データをビジネスに結びつけていくのか、組織の中にどうデータサイエンス、データ分析といった機能をもたせていくのか、そのための人材はどう育成していくのかということを考え始めておくべきだと思います。


データサイエンス・ブートキャンプ、3月開催!

この3月の中旬に、Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプを東京で開催します。

データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に参加を検討してみてください。詳しい情報はこちらのホームページにあります!