Photo by Joshua Sortino on Unsplash

大量のデータを持っていることが競争優位になるというのはただの勘違いだ

「データ・ネットワーク効果」という言葉を聞いたことありますか?

まず最初に、「ネットワーク効果」の部分ですが、これはネットワークに参加することによる価値が、参加者が増えれば増えるほど上がっていくというものです。

古い例としては電話があります。もしこの世に電話を持っている人が5人しかいなかったら大した価値はないでしょう。しかし電話を持つ人が増えれば増えるほど電話を使って話すことができる人の数が増えるので、この電話のネットワークの価値はそのことによってどんどんと上がっていくことになります。最近では、FacebookやInstagramなどのソーシャルネットワーク、UberやAirbnbなどがいい例だと思います。

スタートアップがユニコーンになるかどうかの一つのクライテリアが「ネットワーク効果」を持っているかどうかですが、それはこの「ネットワーク効果」を持っている企業がその市場を独占することになるのが分かっているからで、そのことによって大きな成長を期待することができるからです。

それとは別に、特に昨今のスタートアップのビジネスの成長にとって重要なのは、「データ」です。プロダクトがデータと機械学習のアルゴリズムを使ったものであるのか、ビジネスがデータから得られるインサイトを使って成長させていけているのかということが重要なポイントとなります。

そこで、この2つの「ネットワーク効果」と「データ」を組み合わせ、特に深く考えずに「データネットワーク効果」という言葉を使ってしまっている人たちが多いです。こうした人達にとってはデータを集めれば集めるほど、そのことによって価値が上がっていくので、そのことが競争相手に対するモート(防御壁)になるということになります。

データ・ネットワーク効果ではなく、それはデータ・スケール効果だ

ところが、シリコンバレーでも特に勢いがあって影響力もあるベンチャーキャピタルのA16Zから最近、そんなものはあまり頼りにならないというブログポストが出ていました。

  • The Empty Promise of Data Moats - Link

というのも、「データネットワーク効果」としてみんなが言っているのは、データのネットワーク効果のことではなく、むしろデータの「スケール効果」のことであると言います。

つまり、ネットワークのように増えてくる対象のもの(ユーザーなど)どうしのつながりがより大きな価値を生み出していくといった「ネットワーク効果」に対して、単純にデータが多ければ多いほど価値が高くなっていくというのであればそれはむしろ「スケール効果」であろうということです。

まあ、このへんは言葉の細かい定義の問題なので、ある意味そんなに問題でもないと思います。というのも、それが「データのスケール効果」であったとしても、それが競争上のモートとなるのであれば、それはそれで素晴らしいからです。

ところが、これはこのエッセイのポイントだと思うのですが、その「スケール効果」すら怪しいと言います。

データのスケール効果に関する疑問

というのも、確かにより多くのデータがあるというのはいいことだが、それもある程度のところまでで、その後は逆に集めて運用するコストの割に、それ以上の価値を生み出さないからだと言います。

伝統的な規模の経済の世界では、経済は一定なので、最初の投資が後になって大きな価値を生み出していくことになります。しかし、データの規模の効果は、新しいユニークなデータを収集するコストはがあがります、しかしそこから得られる価値は下がります。
カスタマーからの質問に答えるチャット・ボットの例を考えてみましょう。最初のカスタマーサポートの会話から作り出すデータはシンプルな質問、例えば「私のパッケージはどこにありますか。」に答えることができるでしょう。しかしほとんどの質問というのはもっと煩雑なもので、それも一度だけしか聞かれないようなものです。「家の玄関の前に置かれているはずの私がずっと待っている配達物があるんだけど、それが一体どこに置かれているのかわかる?」と言ったような質問です。こうした限られた場合、役に立ちそうな質問を集めるのはだんだんと難しくなっていきます。40%ほどの質問が集まられた後は、それ以上データを集めたとしても対して違いが出ることはないしそのことが競争優位になることもありません。
でーたはフレッシュである必要がある。実世界のデータというのは古くなっていくもので、そのうち使い物にならなくなります。道は変わるし、気温も変わる、態度も変わる、など。

これは当たり前といえば当たり前なのですが、このことを間違えている人たちがほんとに多いです。これはこちらシリコンバレーでも日本でもよく見かけます。(というか、データがたくさんあるからすごいという話を聞かされる。)とにかくデータを集めればそれが後になってなにかに使えるからどんどん集めてどこかに貯めろ、というやつです。これはおそらくビッグデータ(Hadoopやデータベース)ベンダーのマーケティングによって歪められてしまったのでしょう。とにかくどんどんデータを貯めてデータベースを使ってくれといったことですね。

もちろん、本文でも触れられているように中にはデータが多ければ多いほどいいというドメインもあります。ガンなどのレントゲン写真を使ったスクリーニングの場合は、データが多ければ多いほど予測精度は確かに上がります。

しかし、多くのスタートアップが行っているビジネスにはそうしたドメインというのはそんなにないというのが現実です。さらに、プロダクトの価値を高めるためには、データの量というよりも、使うアルゴリズムの選択によってだったり、プロダクトにどういった機能を付け足すかの判断によってだったりすることが多いというのも現実です。

データ・バーチュアス・サイクル

ただ、Facebook、Airbnb、Uberのようなシリコンバレーの企業はどこもデータを使ってビジネスを大きく成長させていっているというのも事実です。そういった企業は積極的にデータを集めているというのも事実です。しかし、彼らはデータそのものに価値があるとは考えていないので、データを集めることが目的ではありません。

むしろそのデータから得られる顧客やプロダクトに関するインサイトにこそ価値があるのであって、こうしたインサイトによって自分たちのプロダクトやサービスを改善させていくことが目的なわけです。

そして、こうしたプロダクトの改善によってより多くの顧客を獲得することができ、そのことでビジネスが成長していく仕組みを作っているのです。

こうした仕組みを私は勝手にデータ・バーチュアス・サイクル(データによる好循環サイクル)と言っています。

そして、実はこのサイクルの中で一番重要なのはデータから顧客に関するインサイトを得るためのデータ分析の部分です。ここはただ単にテクノロジーやエンジニアリングで解決できることではなく、人間による、ドメイン知識、気づく力、因果関係を構築する力、判断力、といったものを総動員する必要があります。

この部分をしっかり計画し、投資することなく、とりあえずデータを集めれば後でなんとかなるとやっていたのでは、何の効果も出ないばかりか、ただの時間とお金の無駄で終わってしまいます。むしろ実際にデータ分析しようとしたら、必要なデータがとれてなかった、もしくはデータが汚すぎて使えない、といことはよくある話です。

データ・ファーストでなく、顧客・ファースト

よくスタートアップが失敗するパターンの一つに、テクノロジーから始めてしまい、それを使って解決するための問題を探し、そうした問題を持っている顧客を探し、そこからビジネスモデルを考えていくというというのがあります。そうではなく、まずは顧客の問題を見つけ出し、それを解決するためにどういったテクノロジーが必要になるかを考えるほうが、より確実に成功するわけです。

これといっしょで、データから始まり、そのデータを使って何ができるか、どういった顧客の問題を解決することが出きるかという順番ではなく、どういった顧客の問題を解決しようとしているのか、そのためにはどういったプロダクトや機能が必要となるのかを先に明らかにし、その上でそうしたプロダクトを改善していくためにどういったデータが必要となるのかを考えていくべきだと思います。

まとめ

「データのスケール効果」は期待されているほどでもない。それは以下の点からです。

  • データが多ければ多いほど競争優位になる、差別化ができるというようなうまい話はなかなかない。
  • 集めたデータはすぐに古くなって意味がないものになっていくし、さらに汚くてすぐに使えるものでなかったりすることが多い。
  • データを集めれば集めるほど、そこから得られる価値というリターンはどんどん小さくなっていくものである。

それでは、どのようにデータを活用していけばいいのでしょうか。

  • データを集めることが目的になってしまわないようにするべき。
  • 解決すべき問題をはっきりさせてから、データを集めるべきである。
  • データの使い方は大きく分けて2つある。1つはデータプロダクト。データとアルゴリズムを使って予測(またはレコメンデーション)するというもの。2つめはディシジョン(意思決定)・サイエンス。よりよい意思決定をするためにデータからインサイトを得ていく、というもの。
  • データを使ってうまくビジネスを成長させている企業はディシジョン(意思決定)・サイエンスをしっかりやっている。
  • ディシジョン(意思決定)・サイエンスでは、相関または因果関係の仮説を構築するため、そしてそうした仮説を実験するためにデータを使う。
  • このディシジョン・サイエンスの仕組みがあれば、データ・プロダクトに対する投資も責任を持って行うことが出きる。

このへんはファイナンシャル・タイムスがどうやってデータを使ってプロダクト(彼らの場合はメディア・コンテンツを消費するウェブサイト)の価値を高め、ビジネスを成長させているのかという話をしたので、こちらも合わせて読んでみてください。

  • ファイナンシャル・タイムスがシリコンバレーのSaaS企業のようにデータを使って成長しているという話 - Link

データサイエンス・ブートキャンプ、7月開催!

次回のデータサイエンス・ブートキャンプは7月です!

データサイエンス、データ分析の手法を1から体系的に学び、現場で使えるレベルのスキルを身につけていただくためのトレーニングです。

データを使ってビジネスを成長させていきたいという方は、ぜひこの機会に参加をご検討ください!

詳細はこちらのページにあります。

ニュースレターの購読(無料)

今回のような記事を含め、おもに海外のデータサイエンス関連の記事で面白いと思ったものを紹介するExploratory’s Weekly Updateというニュースレターを週一度配信しています。

ぜひこちらのページより登録してみてください!