私が昔オラクルにいた時に一緒に仕事していた仲間が現在もGoogleのCloudチームにいたり、仕事上でもGoogle BigQueryのチームとは仲良かったりしますが、それにしても、最近のGoogleは会社としてはどんどんとIBMやOracleのように悪い意味でエンタープライズ化してきていますね。その顕著な例がカンファレンスでの発表のたびに必要以上なハイプが出てくるということです。

例えば、最近のレストランやヘアサロンの予約の電話ができるといっていたGoogle Duplexですが、結局は限られたシナリオでしかまだ使えないようなデモレベルであったり、AutoMLでMachine Learning(機械学習)を自動化できるといい出したり、さらに最近だとBigQueryでMachine Learning(機械学習)ができるようになると大きな発表をしているわりには、よくみると線形回帰とロジスティック回帰のみのサポートであったり。(ちなみに、線形回帰とロジスティック回帰自体がたいしたことないと言っているわけではなりません。これらは現在でも特にデータ分析系のデータサイエンティストには最も人気のあるよく使われるアルゴリズムですし、このあたりのStatistical Learning(統計学習)系のアルゴリズムはデータの中の関係を解明していきたいようなデータ分析では非常に役立ちます。)

今回は、AIの世界でもそのタレントと研究力に定評のあるfast.aiの人たちがGoogleのAutoMLに関してのハイプを解き明かし、なぜGoogleの主張がおかしいのか、さらになぜそういう事を言う金銭的なモチベーションに関しての解説が「Google’s AutoML: Cutting Through the Hype」という形で発表されていました。ここでは、その一部の「なぜGoogleはAIに関してのハイプを撒き散らすのか」に関しての下りを紹介しておきます。

以下、一部抜粋して訳。


以上のようにAutoMLには様々な限界があるにもかかわらず、なぜGoogleのAutoMLのハイプはそれが証明する役立つ割合に比べて不釣り合いなほどに大きいのでしょうか。

アカデミックな研究部門も企業が抱えてしまうことの問題

GoogleのAutoMLはアカデミックな研究部門を利益を求める企業の中に持つことの危険を提示しています。興味深い学問的な研究成果が出ると、それが実世界でのニーズを満たすかどうかの評価をすることなしに、その技術をもとに新しいプロダクトを作りたいという誘惑にかられてしまいます。これは、MetaMindやGeometric Intelligenceといった、結局ビジネスに繋がるプロダクトを作ることもなしにアキハイアー(人材採用が目的の買収、Aquisition + Hire)で終わってしまった多くのAI系スタートアップにも共通するストーリーです。私からのスタートアップのファウンダーに対してのアドバイスとしては、博士論文をもとにプロダクトを作ることは避けるべきで、アカデミアの研究者だけを採用するのも避けるべきです。

マーケティングのうまいGoogle

Googleはマーケティングが非常に得意です。AIはそもそも外部の者にとっては理解しにくく、恐れ多い分野であり、その主張が本当なのかどうかを正しく評価するのが難しいと思われています。それが特にGoogleのような王者のような会社によって出される主張であればなおさらです。多くのジャーナリストがこの罠にはまってしまい、Googleの作り出すハイプをそのままヘッドラインをにぎわすような記事にしてしまいます。Googleの様々な機械学習のプロダクトの話に興奮してはいるが、そうしたプロダクトには実際に自分の手で触れたことはなく、さらにそれがどう動くのかを説明することも出来ないといった、機械学習を専門としない人達と話す機会が実際よくあります。

Googleによる紛らわしいニュースの例としては、GoogleのAIの研究者が深層学習のテクノロジーを使って人間のゲノムを再構築することができるようになったと、Wiredマガジンが取り上げたときです。 ジョンズ・ホプキンス大学の、Biomedical Engineering, Computer Science, and Biostatisticsの分野で有名な教授であるSteven Salzbergは、その研究は実際には人間のゲノムを再構築などしておらず、それまでのソフトウェアに対する少しの改善か、ひょっとしたらそれ以下かもしれないと指摘することとなりました。他にも多くの遺伝学の研究者がSalzbergに賛同しています。

実際にはたくさんの優れた仕事がGoogleで行われています。こうした私達を間違った方向に導くようなハイプをGoogleが次から次へと発表することがなければもっとそういったことに対して、ポジティブに評価できるのだけに、残念です。

Google Cloudのビジネス戦略はたくさんの計算処理をクラウドでさせること

深層学習のアルゴリズムを効果的に使うためにはもっと大きなコンピューター処理能力が必要だと、私達を説得することがGoogleにとってのビジネス上のメリットがあるのです。なぜならこの分野で彼らは他のどの競争相手よりも優れているからです。AutoMLを使うのは大抵の場合、コンピューターの能力的にとても高価になります。AmoebaNetの学習のために450 K40 GPUs を 7 日間(普通のGPUにして3150日)流し続けるといったGoogleが示す例のように。

エンジニアとメディアはベアメタルのパワーとスケールの大きなものに対して、ついつい興奮してしまいますが、イノベーションとは本来そうしたものから生まれるのではなく、逆に、制約と創造性から生まれるということを歴史は証明しています。Googleはとにかく可能な限り大きなデータと可能な限り最も高価なコンピューター能力を使って問題を解決していくことが得意です。しかし、そうした考え方は、限りある資源の中で、制約の多いこの世界に生きる私達一般の人間が抱える問題の解決にほんとうに役立つのでしょうか。

イノベーションとは、それまでより大きいということから生み出されるのではなく、それまでとは違ったやり方をすることから導き出されるものではないでしょうか。


以上、訳終わり。

ただ、先に公平を期していっておくと、こうしたAIに関するハイプははGoogleだけではなく、どこの企業でも学校でも研究所でも実際多かれ少なかれ起きています。現在のようなAIに関しての狂想曲ががんがんと響いている状況では、そうした状況はしばらくは続くでしょう。

以前、IBMがワトソンというソリューションをマーケティングでハイプを作りながら、できる以上のことをできると約束して売りまくり、その後でいろんな所で吹いている火の後始末で大変になっているという話をしました。

私が昔働いていたオラクルではこういうことはしょっちゅうでした。ものすごい大判風呂敷を広げてとりあえず売りまくりその後で人を沢山放り込んでカスタム、つぎはぎソリューションでなんとかやり過ごす、だめなら、将来の契約へのディスカウントをちらつかせる、それでもだめなら訴訟なんてことになっていましたが。

Googleも今やGoogle CloudとしてAmazon、Microsoftに対抗する形でエンタープライズ向けのビジネスをしっかりとやっていこうということで、そうすると顧客としての大企業の幹部やCIOに伝わりやすいメッセージを出していかなければいけないというプレッシャーが強いでしょうから、それもしょうがないのかもしれません。

しかし、GoogleはAIを含むテクノロジー全般で、あいかわらず最先端を進んでいますし、すでにピークを過ぎシリコンバレーではすでに人気のない会社とはいっても、まだまだ業界でもトップクラスの優れた人材を多く抱えているだけに、安っぽいマーケティング戦術でそのブランドに傷をつけてしまっているのがもったいないように思います。

私が個人的に心配するのは、こうしたハイプで世の中を煽りすぎると、その後その期待が裏切られたときのショックが大きすぎて、AIだとかデータサイエンスに対しての必要以上の警戒心を多くの人の頭に植え付けてしまうことです。これが残念なのは、こうしたAIなり機械学習の手法をさっさとうまく取り入れていくことに成功した企業と、まだ始めれていない企業との差がどんどんとその先開いていってしまうということです。

これは、Googleだけでなく、私達データサイエンスに関わる全ての人間が肝に命じておくべきことだと思いますが、地に足の着いた形で、AIなりデータサイエンスなりを世の中に広めていきたいものです。