Justin Sandefurという人がこちらのツイートで、世界銀行とエコノミストから出てきた世界の貧困層の数のトレンドのデータを可視化する2つのチャートを比べていました。

左のチャートがもともと世界銀行から出されていたチャートですが、それに比べて右のエコノミストから最近出されたチャートを見ると、アジアなどの地域では貧困層の数は大幅に減少していますが、アフリカは減少するどころか、増加傾向にあり、世界の貧困とはアフリカの貧困のことになるということがはっきりと分かると思います。

同じデータ、同じチャートのタイプ(エリア・チャート)ですが、地域の順番を変え、アフリカを一番下に持ってきただけで、こんなにもストーリーがはっきりするいういい例だと思います。

しかし、2つほど注意点があります。

1つ目は、2015年以降は予測だということです。いったいどのように予測したら15年後の2030年の結果がこうなるのかというのは少し疑問があります。そもそも15年前に東アジアでの貧困がこれだけ減少するということを予測できていたのでしょうか。

2つ目は、上のチャートは単純に一日あたり$1.9以下で暮らす人たちの総数を表しています。ということは、単純に人口が伸びている国や地域は、そのせいで貧困層が他の地域に比べて大きく増えていっているということで、貧困層がそうした地域で増えていっているとは必ずしも言えないかもしれません。

この辺に気をつけないと、このチャートを作った人たちの意図するストーリーを鵜呑みにしてしまうことになります。

元になるデータがWorld Bankのこちらのページよりとってくることができるので、手元でさくっと可視化してみたところ、エコノミストが意図するものとは少し違ったトレンドが見えました。

人口のトレンドは以下のようになりました。

ピンクの線がアフリカ(正確にはサハラ砂漠以南のアフリカ)ですが、人口が伸びていく速度が他の地域に比べて急なのが見えます。

エコノミストはなぜか1990年以降のデータのみに絞っているので、1990年に比べてどれだけ人口が伸びているのかをパーセント表示で比べてみました。

一番上のピンクがアフリカですが、いかに人口の成長率が他の地域に比べて大きいのかがわかります。

これでは、例えこの地域の貧困の問題が改善していたとしても人口の増加のペースの方が早ければ、先程のチャートのように貧困の問題が悪くなっていっているように見えてしまうこともありうるでしょう。

ということで、今回のように地域ごとの貧困層の変化の違いを問題にしたいのなら、それぞれの地域の貧困層の割合を出して、それをもってそれぞれの地域を比べたほうがいいかもしれません。それが以下のチャートです。

すると、確かに、東アジアや南アジアの貧困率は大きく減っていっているのが顕著ですが、アフリカ(ピンク)も実は増えていると言うよりは若干減少傾向になっているのがわかります。

ここで、データを使った可視化やストーリーテリングの問題が一つ見えてきます。つまり、どの指標(数値)を使うか、もしくは見せるかによって、ナレーション(Narrative)がだいぶ変わってくるということです。

エコノミストはイギリスのメディアです。イギリスはアフリカに以前、植民地を多く持っていて、今でもそうした国々に対して大変大きな影響力を持っています。(最近では中国に押されているのかもしれませんが。)そして、そうした国から多くの資源をとってビジネスにしています。(一部では搾取と呼ばれていたりもしますが。)そして、この国はそうしたアフリカをはじめとする発展途上国の保守費用を他の国に出させるのが大好きです。そのために(イギリスにとって)都合よく使えるのが国連や世界銀行なわけですね。

そうすると、もし(これは完全に私の推測です)、イギリスが世界中からのお金(日本はもちろんお得意様です。)をアフリカに落としたいとします。それでは、こういうのはどうでしょうか。

貧困の問題というのはこれからはアフリカのみの問題で、その状況は深刻だ。これから国際会議を開き、先進国がGDPのX%を投資するとコミットするべきだ。そして、それは現在中国が行っている以上の投資を約束すべきだ。

すると、上記のエコノミストが出してきたチャートはそのストーリーを効果的にサポートすることができると思えませんか?

誤解のないように言っておくと、アフリカには貧困の問題がないと言っているわけではありません。これが深刻な問題だというのは紛れもない事実です。さらに、その問題は他の地域に比べてあまり改善していないというのもこのデータから見て取れます。ただ、可視化の仕方によってこの問題の解釈の仕方に違いが出てくるという話です。例えば、緊急な問題なのか、様子見でいい問題なのか、といったことです。

もちろん、このWeekly Updateの読者の皆さんは毎週、ストーリーテリング、バイアス、AIの限界などの話に触れていますし、以前にも、「ストーリー・テリングという言葉には気をつけろ」という記事でストーリーテリングの罠にまつわる話を紹介したこともあるので、そんな話に簡単にのってしまうことはないかもしれません。

しかし、そうでない人達はこういうチャートを見せられると、数秒のうちにチャートの作者が伝えようとしているストーリーをそのまま、しかも感情的に受け取ってしまうことでしょう。(むちゃくちゃやせこけて涙を流しているアフリカの子供の写真を見せられるよりはましですが。。。)

今日では、こうした元データは簡単にとってきて自分の手で比較的簡単に分析できるものです。他の人の作ったストーリーに操られてしまう前に、自分で確かめるという癖を、みなさんにもぜひつけていってもらいたいものです。

「データドリブン」になったと思っていたら、実は「データ」として見せられることによって以前よりもっと効果的に勘違いさせられるようになっていたということは、実は多くの会社で起きていることでもあります。


データサイエンス・ブートキャンプ開催!

Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプを東京で開催しています。データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に参加を検討してみてください。詳しい情報はこちらのホームページにあります!