自分の人生やビジネスなどをより良くしたいのであれば、より良い意思決定をしていく必要があります。
そしてより良い意思決定を行うためには現状をより正確に理解する必要があります。つまり真実に迫っていく必要があるということです。
ここでデータを分析する必要があるのですが、データ分析には「確証的データ分析」と「探索的データ分析」という2つのタイプがあります。
こういうと少し難しそうに聞こえますが、これは私達が真実に迫っていくための考え方のスタイルの違いで、哲学の世界では「演繹」と「帰納」的思考と呼ばれているものです。
私達はこの「演繹」と「帰納」的思考という2つの考え方の間を言ったり来たりしながら、現状をより正確に理解し、真実に迫っていくものなのです。
この説明のために、統計学の世界の大御所であるジョージ・ボックス (1919-2013) が「発見のための統計学」という記事の中で、「裁判」と「探偵」の例を使って説明していたので、ここで一部を紹介したいと思います。
以下、一部を要約。
殺人容疑者の逮捕と裁判の例を使って、固定された(確証的な)やり方と繰り返し的な(探索的な)やり方による調査の違いを説明してみましょう。
裁判ではとても厳格なルールのもと、裁判官と陪審員の前に全ての証拠がいっぺんに用意され、陪審員は、無実という仮説が、全ての疑いを押しのけて棄却できるのかどうかを判断しなくてはいけません。
しかし、容疑者の逮捕にいたるまでのプロセスは全く違います。
殺人の状況に関する事実から始まり、そこから引き続き繰り返される調査によってシャーロック・ホームズはバトラーが犯人だという最終的な結論を導き出します。
これは他の探偵の場合でも最初は同じ事実から始まるのですが、ほとんどの場合その後違う行程を経て、しかし最後には同じような結論にたどり着きます。
そうした道のりのユニークさが問題なのではなく、繰り返しを通した学びにおいて最終的に同じ点に集まってくるという点が重要です。
探偵のアプローチは科学における研究者のそれとかなり似ています。
そうして、シャーロック・ホームズがベーカー通り駅の片目の切符切りと話したほうがいいのか、シンシア嬢のいる部屋の窓の下に足跡があるかどうかを探ったほうがいいのか考えるとき、彼はどういった実験をするかを選択し、そしてその実験を設計しているのです。
「こうなるであろう」と彼がもともと思っていたとおりになっていたのかどうかを実験し、もし結果がそうなっていなかった場合でも、その結果が彼の次の手を導きだすのに役立つのです。
良いデータを作り出すことができるスキルと、よい判断力があるとき、こうしたプロセスはもっとも成功しやすくなるのです。
さらに飛行機の発明の歴史にも同じような例を見つけだすことができます。
1800年代の終り、多くの人が飛行機を作ることを考えていました。その中のひとりが当時は最も名声が高かったアメリカの科学者サミュエル・ピアポント・ラングレイです。翼の揚力や航空力学を勉強していた彼は実際に小さな実験のための飛行機が飛ぶためのモデル(数式)を導き出しました。
その後、アメリカ政府はフルサイズの飛行機を作るために当時としては大きな8万ドルを彼に与えました。
そこで彼は、彼の小さな飛行機を飛ばすために使ったモデル(数式)と知識とのみを使ってフルサイズの人が乗れる飛行機をデザインしました。というのも、理論的にはこの数式を使うことでフルサイズの飛行機を作れるはずだったからです。
しかし、彼の作った飛行機が実際に飛ぶことはありませんでした。
ワシントンDCでの最悪のデモンストレーションでは、彼の作った飛行機はポトマック川に突っ込んでいき、危うくパイロットも溺れかけました。
たいていの繰り返し型の調査は多次元的な学び方をします。特に、どのように何が問題なのかを学ぶということはその問題をどのように解決するのかを考える前に必要なステップなのです。
結局成功する飛行機はそうした多次元的な繰り返しによる学びをすることができたライト兄弟によってもたらせられました。
飛行機をどのようにデザインするか、どのように作るか、そしてどのように飛ばすかを発見する必要があったからです。
それは理論と実践の間を行ったり来たりする繰り返しによって達成されました。
飛行機は大人1人とエンジンを載せて飛ばなくてはいけないので、それを考慮した飛行機の形とサイズ、スピードを考慮した上で翼の揚力を計算しなくてはいけません。
彼らが調査を行っていくうちに、それまで受け入れられてきた揚力を計算する数式は間違っているということが明らかになりました。そこでライト兄弟は自分たちで風のトンネルをつくり数式を定義し直しました。これをもとに、エンジンは最大の重さがあるときにどれだけの力を生成する必要があるかを計算することができました。
彼らのスペックに従う軽いがパワフルなエンジンを作ることができる人を見つけることができなかったので、自分たちでそうしたエンジンをデザインし作ることとなりました。
彼らは何をしていたのでしょうか?
それは固定された閉じた世界の中での最適化ではありません。
彼らは理論と実践の間を行ったり来たりしながら、何が適した状況なのかを探し、その状況を作り出す最高の条件とは何なのかを見つけ出したのです。
要約終わり。
サイエンス(科学)とか統計というと数学の世界だと思われがちですが、それは半分合っていて半分間違っています。
というのも数学というのはあくまでも理論であり、与えられた条件がはっきりしている世界でのみ通用するものであり、正確な答えが得られるものです。しかし、この理論が私達には理解しきれない現実の世界で通用するのかどうかは、わかりません。そこで現実の世界(実験室ではありません)で実験を行うことによって学んでいく必要があるのです。
これを理解することなしに、多くの人たちはサイエンスは何か理論的に正しい絶対的な答えを出してくれると思い込んでいる、もしくは期待している人達が多いと思います。
このことが、最近のコロナに関してのロックダウン、マスク、ワクチンなどに対して世の中の多くの人達が誤解してしまっている原因だと思います。
ジョージ・ボックスの言うように、「演繹的思考」という理論が現実の世界と合っていてのかどうかを確認し、さらに合っていないのであれば「帰納的思考」を使って実際に起きていることから理論となる仮説を導き出し、そしてさらに「演繹的思考」で確認するというように、2つの思考の間を言ったり来たりするこでのみ真実に迫っていくことができるはずです。
もちろん、ここでデータが強力な武器になるのですが、データ分析のさいもいっしょで、「演繹的思考」としての「確証的データ分析」と「帰納的思考」としての「探索的データ分析」という2つのタイプのデータ分析を繰り返していくことで、データをもとに現状をより正確に理解していくことができるようになります。
こうして初めて、データを使うことがより良い意思決定につながり、それはより良い人生、キャリア、ビジネスを実現させることができるのではないでしょうか。
データを使ってよりよい意思決定を行うためには、統計学を含むデータサイエンスの手法が役に立ちます。
「データサイエンス・ブートキャンプ」では、机上の空論ではなく、最終的にビジネスの現場でどう活かすのかという視点からデザインされ、プログラミングなしにExploratoryというUIツールを実際に使って手を動かしながらデータサイエンスを学ぶことができます。
次回は11月です。ぜひ基礎からしっかりと学びたいという人は参加してみてください。詳細はこちらのページにあります。