Photo by Annie Spratt on Unsplash

データサイエンス・チームの作り方

これまでに、「データサイエンスに関してビジネスからよく聞かれる質問」というシリーズで以下の2つの記事の訳と解説を書いてきました。

あなたのビジネスのデータサイエンス本気度を試す4つの質問 - Link
データサイエンスをいつ始めればよいか - Link

今回はこのシリーズの最後として、「データサイエンス・チームを組織の中でどう作っていけばよいのか」という質問に対する答えとして、いくつものシリコンバレーのデータ先進企業でデータサイエンスのチームを作り、率いてきた、このシリーズではおなじみのJeremy (Instacart, Sailthru, Collective) とDaniel (LinkedIn, Ebay, Apple) によるアドバイスを要訳という形で紹介します。

以下、要訳。

データサイエンスのチームはどこに作られるべきか

組織の中にデータサイエンスのチームを作る場合には大きく分けて３つのタイプがあります。

独立タイプ、組み込みタイプ、そして一体化タイプです。

それぞれ良い点と悪い点があるので、見ていってみましょう。

独立タイプ

独立タイプの場合は、データサイエンス・チームはエンジニアリング・チームのように独立した部門となり自分たちでマネージメントを行っていくことになります。

データサイエンス部門のトップは組織の中の重要なリーダーとなります。プロダクト部門やエンジニアリング部門のトップの直属というのがよくあるケースですが、CEOの直属というケースもあります。

この独立タイプは、意思決定のサイエンス（Decision Science）タイプのデータサイエンスチームにこそもっとも適しています。

意思決定のサイエンティストはプロダクト・チームと緊密に協業することになりますが、彼らが独立した組織にいるということが、難しい決定をする助けになります。例えば、プロダクト・マネージャーに対して、彼らのプロダクトの指標がプロダクトをローンチするには十分でないと提言することができます。

このモデルでは意思決定のサイエンティストは、異なるプロダクトの指標がそれぞれどう影響し合うかを理解することができ、実験とデータ分析からの学びを、同じデータサイエンス・チームの他のメンバーと共有していくことができます。

この独立タイプのマイナス面は、だんだんと影響力を失っていくリスクがあるということです。会社が大きくなっていき、プロダクトチームがしっかりとでき始めると、プロダクトチームは自分たちで全てをコントロールしたくなるものです。

データサイエンティストたちと協業することで大きな利益があるにも関わらず、プロダクトチームは自分たちでコントロールすることのできない人たちに頼りたくないものなのです。

そこで、自分たちでデータサイエンスの仕事を行なうために、自分たちのグループの中にデータサイエンティストを、リサーチ・エンジニアという名前をつけて雇い始めたりします。

もしプロダクトチームが独立したデータサイエンスチームとの協業を拒み始めると、データサイエンス・チームは影響力を失い、仕事の効率が落ちます。そして、この時に優れた人材を失い始めることになるのです。

LinkedInでの最初のデータサイエンス・チームは独立したチームでした。チームの独立性のおかげでLinkedInの様々なプロダクトに重要な貢献をすることができました。その貢献は「この人を知っているかも」というレコメンデーションや不正アカウントの検出など多岐にわたります。

しかしLinkedInが成長するに連れ、独立したチームがプロダクトチームと効率的に協業していくのが難しくなってきました。特にプロダクトチームがデータサイエンティストと同じようなスキルを持った「エンジニア」を自分たちで勝手に雇い始め出してからです。

最終的にLinkedInは独立したデータサイエンスのチームは必要ないという決断をすることになりましたが、これはよくあるケースです。

組み込み型

組み込み型では、データサイエンス・チームはメンバーを組織の様々なチームに派遣することになります。データサイエンス・チームのトップはいますが、彼もしくは彼女の主な仕事は雇用のマネージメントとメンバーに対する指導となります。

組み込み型はさきほどの独立型の全く反対のモデルです。独立性をあきらめ、サービスを提供するユーティリティとしての立場を受け入れることになります。うまく言ってる場合は、データサイエンティスト達は彼らのサービスを必要とするプロダクトチームに参加し様々な問題を解決していくことになります。

このタイプのマイナス面としては、全てのデータサイエンティスト達が独立性をあきらめることに対して快く思っているわけではないということです。

データサイエンティストの仕事を説明する時に、創造性とイニシアチブ（新しいことを自分で始めていく）といったことを強調しますが、組み込み型ではそうしたことは組み込まれたチームのリーダーの仕事になってしまいます。

LinkedInの意思決定サイエンスのチームはこの組み込み型モデルで長い間、成功してきました。

意思決定サイエンティスト達はプロダクトチームがデータを理解した上で意思決定（特にプロダクトのローンチに関するもの）するためのサポートを行ってきました。そして、サイエンティスト達が属するデータサイエンスチームはメンバー間の知識の共有とメンバーのキャリアの開発に対しての責任を持っていました。

一体化タイプ

一体化タイプはデータサイエンスのチームというものは全くありません。代わりにプロダクト・チームが自分たちで必要なデータサイエンティストを雇い、そのマネージメントを行うことになります。

これは組織的な統制をとるためには最も適しています。

データサイエンティストをプロダクトチームの主要メンバーとすることで、独立型や組み込み型にみられたマイナス面を解決します。

データサイエンティスト、ソフトウェア・エンジニア、デザイナー、プロダクト・マネージャーたちは共有されたプロダクトのゴールに向かっていっしょに仕事をしていきます。このタイプはゴールに対して共同で責任を持つのだという意識を植え付けることができるのです。

このタイプのマイナス面は、データサイエンティストとしてのアイデンティティが失われていくことになります。それぞれのデータサイエンティストは自分たちの存在価値を、中心となるデータサイエンス・チームではなく、プロダクトチームの中に見出す必要があるからです。

また、組み込み型に見られたような柔軟性を失うことにもなります。データサイエンティスト達の持つスキルや興味をもとに、チームを換えたりすることが困難だからです。

最後の問題として、サイエンティスト達のキャリアの開発が難しくなります。チームのマネージャーはデータサイエンティストの仕事の価値を理解し、適切に評価するためには最も適しているとは限らないからです。

データサイエンスが活躍するための文化を作るにはどうしたらよいか

企業は、多くの人に受け入れられている意見と異なる場合や、組織の中の力関係の大きな変更につながる場合でも、意思決定はデータをもとに行っていくための仕組みと信用を作るために努力していかなくてはいけません。

私がデータチームのリーダーとしてSailthruに参加した時、そこのエンジニアリング・チームはデータサイエンスに対してどちらとも言えない立場をとっていました。

そこで、データサイエンスに対する賛同をみんなから得るために、最初の2ヶ月の間、私の持っていた時間の30％を費やして、統計モデルのクラスを作り、エンジニアたちに教えることにしました。

授業では全ての例にSailthruの実際のデータを使うことで、データ・ドリブンなプロダクトを作っていくプロセスにエンジニアのみんなを巻き込んでいくことで、データサイエンスに対するみんなの認識を一気に変化させることができました。

こうしたことに費やされた時間の投資コストはたしかに高いものでした。しかし、エンジニアがデータサイエンスの可能性に興奮し、データサイエンスのプロジェクトを行なうパートナーとなってくれたことで、その投資からの十分なリターンを得ることができました。

データサイエンスはサイエンスでもあり、またそれと同じくらいアートでもあります。全てのことが計測できるわけではなく、さらに私達ができることはアルゴリズム、コンピューターの能力、そして私達の知恵によって限られているのです。

最後に、データサイエンティストを雇うときは、あなたの会社が理想とすることを共有できる人たちを雇うことに最初から心がけるべきです。

効率的に仕事を行っていくには、データサイエンティストは、組織の中のチーム、自分たちのプロダクトのユーザー、そして意思決定を行なう人達から信頼されなければいけません。

データサイエンスのチームを作っていく時、あなたの組織にとって重要な価値を共有できる誠実な人たちを雇っていくべきです。彼ら、彼女たちの与えるインパクトはとても大きなものです。そして彼ら、彼女たちはあなたの会社の将来を形作っていくことになる多くの意思決定を行っていくことになるのです。

以上、要訳終わり。

あとがき

シリコンバレーのデータ先進企業でも、どのようにデータサイエンスのチームを組織の中に作っていくかというのはいろいろと試行錯誤をしているようです。これが正しいと言ったモデルがあるわけではないので、その時の状況に合わせて柔軟に対応していくことになると思います。

ただ、最初はデータサイエンスをわかっている人（データサインティストである必要はない）のもとに独立したチームを作り、強力なリーダーシップのもとに優れた人を集め、チームを作っていくというのがよくあるパターンのようです。

スタートアップの場合は早い時期からこうしたチームを作り始めることができ、データサイエンスが全体のビジネスに対するインパクトも大きく、さらにCEOを始めとするトップが直接深く関わることもできるので、組織の中にデータをもとに意思決定を行っていくという文化を形成しやすいと思います。このことは、今日新しいビジネスを成長させるという点で、スタートアップが大企業に比べて圧倒的に有利な点だと思います。

このことが、シリコンバレーのスタートアップが既存のビジネスを淘汰しながらどんどんと成長していく大きな理由です。シリコンバレーで勝ち残って行く企業は、どこもデータ先進企業なのです。

ただ、逆に考えると、シリコンバレーのスタートアップにできるのであれば、日本のスタートアップにできないわけはないと思います。そこで、なるべく早い時期からデータに関する人材にこそ投資していき、データをもとに意思決定を行っていくという文化の形成に努めるべきだと思います。

SaaSアナリティクスと探索的データ分析のトレーニング5月開催！

Exploratoryでは来る5月、データとアナリティクスを使ってSaaS/サブスクリプション・ビジネスを改善していくための「SaaSアナリティクス」というトレーニングと、データの可視化とアナリティクスを使って、予測と因果関係の理解に役立つ仮説を構築していく「探索的データ分析」のトレーニングを開催します。

データとアナリティクスを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください！

詳細は以下のページよりとなります。

Exploratory データ・アカデミー