好奇心ドリブンのデータサイエンスがイノベーションを生み出す

以前紹介したことのある、個人の好みのスタイルに合わせた服をスタイリストとAIのアルゴリズムを使って選択し、配送してくれるStitch Fixというサービスがこちらサンフランシスコにあります。ここは世界でも初であるChief Algorithm Officerという役職のもと、独立したCEO直属のデータサイエンス部門があることでも有名な、データサイエンス先進企業です。

そこのチーフ・アルゴリズム・オフィサーであるEric Colsonが、なぜデータサイエンスこそがこの時代にイノベーションを生み出すことに一番向いているのか、また、フルスタック・データサイエンティストとは何か、なぜ必要なのかといった点に関して、ハーバード・ビジネス・レビューに掲載されている記事の中で簡潔にまとめていたので、こちらに紹介したいと思います。

以下、要訳。


Curiosity-Driven Data Science - Link

データサイエンスがイノベーションを生み出す仕組み

できるデータサイエンティストというのは好奇心が旺盛です。

彼らははっきりとしたゴールを目指して仕事を行い、特定のパフォーマンスを測る指標を達成することに集中し、そのことに対して責任を負っています。

しかし、彼らは、いい意味で気が散ってしまいがちです。データを探索している間に様々なパターン、現象、異常値を見つけることになりますが、このことがデータサイエンティストの好奇心をそそります。

「顧客のスタイルを特徴づけるためのより良いやり方はないだろうか。」

「もし、服のフィットを距離のアルゴリズムを使ってモデル化することができたら、さらによい顧客のフィードバックを得られるだろうか。」

「すでにあるスタイルからうまく抽出できた属性をまぜ合わせることで、さらに良い属性を作ることができるだろうか。」

こうした質問に答えるために、データサイエンティストは過去のデータと向き合い、試行錯誤を繰り返すことになります。彼らはこうした事を勝手に行います。時には、先程のような質問に答えるための説明は、それこそ数時間といった具合にすぐに得られるものです。そうでなく、もっと時間がかかることもあります。というのも、一つ一つの質問が新しい質問や仮説を呼び起こし、さらなる実験や学習へとつながるからです。

それでは、彼らは時間を無駄にしているのでしょうか。そんなことはありません。データサイエンティストは探索的な仕事をすばやくできるだけではなく、他のドメインと比べてそうした探索から得られる価値を比較的簡単に計測することができます。

AUC、RMSE、R-Squaredといった統計的な指標を使って、データサイエンティストが行った探索から得られたインサイトが予測能力に与える価値を数値化することができます。こうした指標とビジネスの業務知識を足すことによってデータサイエンティストは彼らの発見する新しいインサイトを使ったソリューションのもつ意味と、それがビジネスに与えるインパクトを評価することができるのです。

ポイントは、だれもデータサイエンティストにこうしたイノベーションを起こせとは頼んでいないということです。彼らは、説明できない現象を目にし、何かを思いつき、勝手に試行錯誤し始めるのです。こうした作業は比較的簡単に行えるので、彼らは事前に許可を求めることもありません。もし彼らが許可を求めていたなら、マネージャーなり、関係者はおそらく「No」と言っていたかもしれません。

コストの低い探索と結果を計測することができるという2つのことがデータサイエンスが他のビジネス部門と全く違う点です。もちろん、他の部門の人達も好奇心は旺盛でしょう。

「クライアントはこの手のクリエイティブにいい反応を示すだろうか。」とマーケターの人は質問するかもしれません。

「新しいUIはより直感的だろうか。」とプロダクト・マネージャーは質問するでしょう。

しかし、こうした質問は過去のデータからは答えることができません。こうしたアイデアを探索するには実際に何かを作る必要があります。そしてそれはコストの高いものです。そしてそのコストを正当化するのは多くの場合難しいのが現実です。というのもそのアイデアがうまくいくという保証がどこにもないからです。

低いコストで探索でき、リスクを減らすためのエビデンスを得やすいので、データサイエンスはより多くのことを試すことができ、それがより多くのイノベーションにつながるのです。

データサイエンスでイノベーションを起こすのに必要な環境づくり

それでは、こうしたことをどうすればできるのでしょうか。これは、単純にうちもやってみよう!と号令をかければいいようなものではありません。これまでとは全く異なるアプローチが必要になります。そしてまずは環境づくりから始める必要があるのです。

CEO直属の独立した部門としてのデータサイエンス

まず最初に、データサイエンスを独立した部門とする必要があります。マーケティング、プロダクト、ファイナンスといった別の部門の下に置いてはいけません。その代りに、CEOに直接レポートする独立した部門とするべきです。時には、データサイエンスチームは他の部門と一緒に仕事をし問題を解決していくことになります。しかし、それは対等なパートナーとしてであって、言われたことをやるだけのサポートスタッフとしてではありません。

データサイエンスを他の部門にサービスを提供するサポートチームとして位置づける代わりに、ビジネスのゴールに責任を持つチームとして位置づけるべきです。そしてそうしたゴールの達成に説明責任を負わせるべきですが、そのための問題解決方法は自分たちで見つけていけるようにするべきです。

フルスタック・データサイエンティストへの投資

次に、自分たちで独立して仕事ができるように技術的なリソースをデータサイエンティストたちにしっかりと与えるべきです。彼らの探索を可能にするためにはデータへのフルアクセスが必要で、さらにコンピューティングのリソースも必要です。こうしたことにいちいち許可を求める必要があるのであれば、そのための余計なコストが発生することになり、また探索をしようという意志も減るでしょう。

コンピューティングのリソースを追加しやすく、いくらでも好きなだけ増やすことのできるクラウド環境を使うのがおすすめです。

データサイエンティストは自分たちで探索を行っていくために、専門家であると言うよりも、Generalist(何でもできる人)である必要があります。ほとんどの企業で、データサイエンティストをいくつかの専門家に分けてしまっているのを見受けます。例えば、モデラー(モデルを作る人)、機械学習のエンジニア、データ・エンジニア、因果推論のできるアナリストと言った具合です。

しかし、これではどんな探索を行うにもより多くの人が必要になります。複数の人を調整しようとするとすぐにコストが高くなります。その代りにこうした全ての機能を行うことができるフルスタック・データサイエンティストを増やすべきです。こうしたアプローチが新しいことを試す時のコストを下げることになります。一人で様々なことをすばやく試行錯誤できるからです。

もちろんデータサイエンティストはすべてのことの専門家にはなれません。そこで、分散処理、自動スケーリングなどといった複雑なことを抽象化してくれるデータプラットフォームを用意する必要があります。こうしてデータサイエンティストは実験と学習を通してビジネスの価値を生み出していくことに集中でき、技術的なことに余計な時間を使わずにすみます。

実験と学習の文化づくり

最後に、すばやい学習と実験を行うためのプロセスをサポートするための文化が必要です。これは、例えば、やりながら学ぶ、不確定性を当たり前とする、長期的と短期的に得られるリターンのバランスをとる、といったことを会社全体での共通の価値感として持つということです。こうした価値観は全社で共有する必要があります。一部のチームだけで持とうとしてもそれは長続きしないでしょう。

古くて大きな企業へのチャレンジ

しかし、ここで、これを採用する前に一つ注意が必要です。これは古い企業では不可能かもしれませんし、可能だとしてもそれはかなり難しいこととなるでしょう。たとえStitch Fixでも、もし最初からデータサイエンスを独立した部門として位置づけていなかったら、ここで述べてきたようなことができたかどうかは疑問です。取締役会に席を持つものとしてStitch Fixに6年半ほどいますが、組織にデータサイエンスを持ち込むような努力をする必要は一度もありませんでした。むしろ、データサイエンスは私達にとっては自然にもとからあるものだったのです。

これは,古い企業ではデータサイエンスは失敗すると言っているのではありません。ただ、一からやるのに比べて確実に大変でしょう。こうした大きく困難な変化を起こしてきたようないくつかの企業は実際にあります。そして、データサイエンスはあまりにもビジネスにとって重要すぎるので、こうした変化を起こすことにチャレンジしないということはありえないでしょう。ここで述べてきたやり方から得られる恩恵はあまりにも大きいのです。データサイエンスを自分たちのビジネスの競争的優位にしたいのであれば、このアプローチがあなたの企業にとってうまくいくか、いかないか、それはどんな企業であっても、少なくとも試すべきでしょう。


以上、要訳終わり。

コメント

データに近いところにいて、さらにそれを使いこなすことができれば、ビジネスにおける疑問に答えるための答えをより早く、より確実に出しやすいという点で、たしかにデータサイエンスはイノベーションを起こしやすい世界なのかもしれません。ついつい、データ分析というと、既存のビジネスを改善していくという文脈で捉えられることがあります。しかし、顧客により良い価値を提供することに情熱を持っているのであれば、様々なアイデアがよく浮かび上がってくるものですが、それらを仮説として、すばやくデータを使って検証、実験し、学んでいくことができるのであれば、それはイノベーションにつながっていくことでしょう。

Stitch Fixはシリコンバレーでさえまれな、チーフ・アルゴリズム・オフィサーというCEO直属のリーダーに率いられている独立したデータサイエンスのチームがあります。これは、この会社にとって、アルゴリズムこそが戦略的に重要だからですが、こうした企業はこれからもどんどんと多くなっていくのではないでしょうか。

現在のような、ソフトウェアを中心とする時代ではデータを使わないでイノベーションを起こしながら勝ち残っていくというビジネスがどれだけあるのでしょうか。

このことは、現在の多くの大企業にとってはつらいところだと思います。ソフトウェアの流れに乗れていない企業は、現在の競争の場であるデータの流れにも乗れないことになります。

本文の最後にも書かれていたように、大企業にとってはデータを使ったイノベーションを起こすための体制づくりは果てしないほど困難だと思います。また、そうしたデータサイエンスというCEO直属の部門が作れたとしても、その部門を率いることができ、さらにCEOや取締役会に対する説明責任を負うことができるような人材をどこから見つけてくるのでしょうか。

ただ、こうした人達こそがこれからの日本を背負っていく人たちになるはずですから、データサイエンスに現在関わっている人、またはこれからやっていきたいという人に対する期待は大きいと思います。

データサイエンス・ブートキャンプ、1月開催!

次回ブートキャンプは来年1月です!まだ若干空きがありますので、データサイエンスの手法やデータ分析をゼロから体系的にいっしょに学びたいという方は、この機会にぜひご検討下さい!

詳細を見る