今回は「A Second Chance to Get Causal Inference Right: A Classification of Data Science Tasks」という予測と因果関係の違いを解説した上で、「因果推論」の重要性と緊急性を訴えるエッセイの訳の第3回目です。今回が最後になります。
第1回目は、データサイエンスのタスクを、記述、予測、因果推論(反事実的予測)という3つのカテゴリーに分け、それぞれの定義的な違いの話をしました。
第2回目は、より具体的に、予測と因果推論は何が違うのかというのを、自動化できるかどうか(機械)、人間によるドメイン知識を必要とする(人間)かどうか、といった点から見ていきました。
今回は、意思決定という観点から予測と因果の違いについて見ていきます。
以下、要訳。
データサイエンスのゴールは人々がよりよい意思決定を行えることです。例えば、健康に関する領域だと、患者、医者、医療に関する政策立案者、公共医療の責任者、規制を作る役人、と言った人たちが、いくつかの実現可能なオプションのうちどれを選ぶかについて、よりよい意思決定を行えるようにするということになります。
ここでよく聞くのは、データサイエンスを使うとよりよい意思決定が行えるようになるというのは、それが予測という分野でうまくいっているからだ、というものです。
しかし、予測のアルゴリズムがよりよい意思決定に結びつくというのは疑問です。
心臓に問題のある患者のデータを使って次の5年の間に死ぬのは誰かと予測するアルゴリズムは、どうすれば死亡率を下げることができるかということに関しては全く使えません。
例えば、過去に入院したことがあるということが死亡することを予測することに役立つ情報だとわかったとします。しかしそのことは、死亡率を減らすために病院は患者を入院させるべきでないということになるでしょうか。
悪い予兆のある患者を見つけ出すことと、病気を防いだり治療したりするために必要となる最も最適なアクションを見つけ出すこととは全く違うものなのです。
さらに悪いのは、もし予測と因果推論を混乱してしまうと、相関しているように見えるものに騙されてしまい、例えば妊娠中の喫煙は、生まれる時に体重の軽い赤ちゃんにとってはよいこだと結論づけてしまうことにもなりかねません。
予測のアルゴリズムは、何らかの意思決定が行われるべきということを知らせてくれるかもしれませんが、私達の意思決定を助けてくれるわけではありません。
例えば、深刻な心臓の欠陥のある患者を見つけ出す予測のアルゴリズムは、心臓を移植するということが、現状の中で最も良い治療の選択肢なのかどうかを判断するための情報を提供してくれることはないのです。
それとは対照的に、因果に関する分析というのは私達が意思決定を行うのを助けるために設計されています。なぜなら、「もしこういったことをしたらどうなるか」と言った質問に答えることができるからです。
因果に関する分析をすることで、ある深刻な心臓疾患をもった患者に対して、医療的な治療を行うべきか、それとも心臓の移植を行うべきか、ということに関しての良い点とそれに伴うリスクを比較検討することができます。
おもしろいことに、関連のあるドメイン知識がアルゴリズム自身に組み込まれている場合は、予測と因果推論(反事実的な予測)の違いを認識する必要はなくなります。
碁をやることを学んだ単純に「予測」だけを行うアルゴリズムは、様々な動きに対しての反事実的な状態というものを完璧に予測することができます。
そして、車を運転することを学んだ「予測」のアルゴリズムは、反事実的な、例えば、ブレーキが動かない場合に車がどうなるかということを予測することができるのです。
こうしたシステムは事前に決まったルール(例えば碁のようなゲーム)、または確率的な要素を持つ物理的な法則(例えば自動運転のようなエンジニアリングのアプリケーションなど)によって支配されているので、ある想定された介入があった場合に、システム全体がどう動くのかといったことを、アルゴリズムが予測することができます。
アルゴリズムが駒を動かす時、ゲームのルール、現在の碁盤における位置、一連の動きが引き起こすであろう結果、といった関係のある情報全てにアクセスすることができます。
さらに、強化学習のアルゴリズムは自分自身でどんどんとゲームをプレイすることでデータを勝手に生成していくことができ、そのことによってトライ・アンド・エラー(試しては間違える)ということを繰り返しながら学んでいくことができます。
こうした環境において、強力なコンピューターの上で走っている賢いアルゴリズムは人間を圧倒的に凌ぐことができます。ただし、このタイプの「因果推論」は使える領域や用途が限られているというのが現状です。
多くのサイエンティストは、全ての必要なデータが手に入るという確証がなく、一部しか分かっていない、そして支配する法則(ゲームのルール)が決定的でないような複雑なシステムを相手にした仕事をしています。トライ・アンド・エラー(試して、間違える)を繰り返しながら学んだり、一つの実験さえ行うことが可能ではないようなシステムであったりするのです。
例え、法則が明らかでデータが手に入ったとしても、そのシステムは長期的な予測を行うには混沌としすぎているかもしれません。例えば、地上250kmの上空の軌道に乗っている中国の宇宙ステーションがいつどこで地球に落ちるのかを予測するのは不可能だったのです。
腎臓疾患の患者に対して、異なるエポエチンの処方が死亡するかどうかに与える影響に関しての因果の質問を考えてみてください。私達はどの分子、細胞、個人、社会、そして環境といった様々な要素がエポエチンが死亡のリスクに与える効果にどう関わっているのかを理解していません。
結果として現在では、どういった処方をすることでどういった結果が得られるかという予測を再現可能な形で行うことは、例え全ての健康に関するデータが手に入ったとしても不可能なのです。
IBMの「Watson for Oncology (腫瘍学)」のような多くの人が知ることになった大失敗のデータサイエンスのアプリケーションはこうした問題のいい例です。まだ良く理解できていない複雑なシステムを「予測」モデルによって解決しようとしてしまったことによる結果、とんでもない災害となってしまいました。本来であれば、専門家による因果関係の知識とデータが必要であったのですが、それがないのが問題なのです。
多くの伝統的なデータサイエンティストたち(統計学者、疫学者、経済学者、政治学者など)の注意深い態度と、多くのコンピューター・サイエンティスト、情報学者たちの「Can do(できる)!」という態度の間にあるあまりにも明らかな違いは、それぞれのグループが歴史的に取り扱ってきた因果に関する質問の複雑さの違いによる結果ではないでしょうか。
疫学者や、ものすごく複雑なシステムを相手に仕事をしてきた他のデータサイエンティスト達は、比較的控えめなゴールに集中し、ある変数が与える平均的な因果効果といった狭い領域での因果に関する質問に答えるために行うデータ分析を設計します。システム全般の因果の構造を解明しようとしたり、世界中のどこでも通用するような最適化された意思決定の戦略を見つけようとすることはありません。
逆にデータサイエンスの世界への新参者(newcomers)たちは、すでに法則が分かっているシステム(例えば、囲碁やチェスといったボードゲーム、自動運転など)に集中しがちです。
ですので予測と因果推論の違いをあまり重視しないのは驚くべきことではありません。
しかし、この予測と因果推論の違いにもっと注意を向けることが今ほど重要な時はありません。というのも、これまでは健康に関するサイエンティスト、社会科学の専門家によって質問されていたような因果に関する質問に、現在ではより多くのデータサイエンティストたちが答えているからです。
洗練された予測のアルゴリズムは最強のGo(碁)のソフトウェアを開発したり、将来的には安全な自動運転の車を作るには十分かもしれません。しかし、複雑なシステム(例えば、慢性疾患を治療するための医療戦略の効果といったような)は因果関係に関する知識をともにした、データ分析の手法を必要とするのです。
データサイエンスが意思決定のための信頼に足る道具となるためには、しっかりとしたサイエンスの追求には因果推論が必要となるのだと認識するのが最初の一歩です。
最後に、予測と因果推論の間の違いをはっきりさせることはAIを定義する上で欠かせません。あるデータサイエンティストのグループは、知能の本質とは予測することなので、良い予測のアルゴリズムはAIの実現だと主張します。こうした視点からは、データサイエンスの大きな部分はAIだとしてブランドを定義し直すことができます。そして、これこそがまさにテック業界が現在行っていることです。
しかし観察されたインプットを観察されたアウトプットにマッピングするというのは私達が期待するような知能とは程遠いものです。
むしろ、知能が知能である所以は、様々なアクションが取られた時に世界がどう変わるのかといった、反事実的な予測ができるかどうかということです。それには専門的な知識とアルゴリズムを統合することが必要なのです。
因果推論もできないものは、AIと呼ぶにふさわしくありません。
以上、要訳終わり。
データ分析をするのは人間がよりよい意思決定をするためだと思います。そしてよりよい意思決定をするためにはどうしても因果関係というのを理解したいと思うのが人間です。
予測によってこのお客さんには時間を費やさないほうがいい、となった時、「なぜ?」と聞きたくなるのは当たり前です。
お客さんがキャンセルした時、それが90%の確率で予測できたかどうかはある意味どうでもいいことで、それよりも、何をすればキャンセルを事前に防げたのかということこそ知りたいはずです。
データを分析してそこから得られたインサイトを使ってビジネスの課題を解決していくためによりよい意思決定をしたいというのであれば、予測モデルの性能を上げることに時間を費やすよりも、何をすれば問題が解決されるのかという疑問に答えるための仮説の構築に時間を費やすべきではないでしょうか。
どのサイト訪問者がコンバートするのかではなくて、どうしたらサイト訪問者をコンバートできるのか。どの顧客がキャンセルするのかではなくて、何をすればキャンセルを防ぐことができるのか。
こういったアクションのための仮説を構築していくためには「因果推論」の方が「予測」よりも役に立ちます。そして、この「因果推論」には、もちろんその基礎となる最低限の知識が必要だとはいえ、それよりも実は業務に関する深い知識が重要だというのがこのエッセイのポイントなのではないでしょうか。
そして、このことこそが、データサイエンスは、ビジネス側の人間にこそほんとうは必要とされている知識であり、スキルであるのだと私が思う所以です。
次回のデータサイエンス・ブートキャンプは11月です!
ビジネスを成長させるためにはデータを使って因果関係に関する仮説を構築し、実験するというサイクルを効率的に回していく必要があります。そしてそのためには統計、機械学習を含むデータサイエンスの手法を習得する必要があります。
「データ・インフォームド」な意思決定を行いたい方、データサイエンスを1から体系的に学びたいという方はぜひ参加してみてください。
詳細はこちらのページにあります。
今回のような記事を含め、おもに海外のデータサイエンス関連の記事で面白いと思ったものを紹介するExploratory’s Weekly Updateというニュースレターを週一度配信しています。
ぜひこちらのページより登録してみてください!