データサイエンス・ツールⅢ

前半レポート

理工学部 経営システム工学科 18D7102027F 岡田華奈



[問題1.8.1]
(1)
データには Starbucksというブランド名以外にも系列店が含まれている.これらの割合(Starbucks が全体のどの程度を占めるか等)について,数値やグラフを用いて説明する.

<分析結果>
まず,割合をグラフィカルに見るために円グラフを用いて分析をした. 全店舗に対する"Starbucks"の割合としては,98.63%であった. また,他の系列の店舗数も数字で確認するために,tableでも出力した.以下の通りである.


<分析の考察と補足>
・ Cofee House Holdingsは1店舗しかないが,調べても出てこないため,本社ではないかと考える.
・Evolution Freshはジュースバーであるが,参考文献[1]にもあるが,2017年に全店舗閉店した.データの参照元のサイトを見るとUpdateが2017年とあるので,新しいデータではこの店舗はない.
・ Teavanaは昨年日本にも単独店舗が進出したため,店舗数も増え,割合にも影響しているのではないか.
・同様にして,参考文献[2]の通り,店舗数は2017年から比べると32,943店舗と店舗数を増やしているため,さらなる割合の変化が見込まれる.


(2)
以下の分析では Starbucks というブランドだけに限定して分析する. 国ごとの店舗数の合計数を求める.

<分析結果>
まず,ブランド名をStarbucksに指定して,フィルターをかける.
その後,集計テーブルでCountrycodeごとに集計した.しかし,Country codeだと見辛いので国名に変換してテーブルにまとめた.



<分析の考察と補足>
・人口に比例して店舗数が多いように感じる.この分析に関しては,以下(3)以降で行う.
・しかし,人口から考えると中国の店舗数が少ないように感じる.これは,中国ではコーヒーよりお茶を好む文化にあるからではないかと考える.(烏龍茶やプーアル茶やジャスミン茶などを考えて)
・アメリカとそれ以外の国の店舗数がかなりさがあるように感じる。これは、スターバックス自体がアメリカ発祥であることが関係していると考えられる。


(3)
国により人口が異なるので,人口 10 万人当たりの店舗数を計算していく.
まずは,Starbucksの各国の店舗数の横に2017年の人口が表示されるようにする.

<分析結果>



なお,人口データだが,国際連合のウェブサイトからダウンロードしたものでは,うまくISO2での結合ではなく国名での結合ができなかったため,参考文献[3]のサイトからデータをダウンロードし,国名での集計を別に行った. これは見やすさのために行ったものであるので,以下の分析では国連のデータを用いて行う. 参考文献[3]を用いた集計結果は以下の通りである.


<分析の考察と補足>
・人口に比例しているのではないかと考察したが,集計結果を見る限り完全に比例しているわけではないのがわかるので,人口だけが説明因子ではないのではないかと考える.
・他の説明因子としては,コーヒーの国内消費量やGDPなどがあるのではないか.
コーヒーの国内消費量[4]とGDP[5]を先ほどの集計テーブルの隣の列にまとめた.



このようにして見ると,GDPに関しては人口よりは相関があるように見えるが,こちらも人口同様に完全な相関は見られない.
また,コーヒーの国内消費量に関してはデータが少なくあまり参考にはならなかったが,3000(thousand 60kg bags)を超える消費量の国が100店舗以上を有するという,1つの基準となる値が見つかったと考える.


(4)
人口10 万人当たりの店舗数を計算する.
そして,その値によって各国を塗り分けたコロプレス地図を作成し考察する.

<分析結果>
・データに基づく人口10万人あたりの店舗数の計算結果



・データに基づく人口10万人あたりの店舗数によるコロプレス地図
・K-meansクラスタリングによるコロプレス地図

<分析の考察と補足>
・人口10万人あたりの店舗数だけでは,関連性が見えてこないので,ここでGDPについてのコロプレス地図を用いて考える.
上図を見ると,まず,mapの色が濃い国すなわち,GDPの高い国に,スターバックスの店舗があることがわかる.
ここで,先ほどのmapで色が濃かった国を中心に抽出し(具体的には,GDP>103,445,500,000),mapをもう一度出力すると,以下のようになった.

このmapを見ると,もともとの人口10万人あたりの店舗数のmapとほぼ同じ濃淡になっていることがわかる.
このことから,全ての国でのコロプレス地図では,一見GDPは関係のないように見えるが,このように一定のGDP以上の国に絞ってコロプレス地図を出力することで,関連性が見えるのではないか.
・基本的には隣国同士は,色分けの階層の隣り合う色になっているため,国単位での出店もあるが,ある程度は地域を意識した出店なのではないかと考えた.
・また,島国は色が濃いため出店数が多いことがわかるが,これは先ほどの考察から考えると,島国は隣接する国が存在しないので,陸続きの国では他の国にばらけているものが集まっているためではないかと考える.


(5)
店舗形態(OwnershipType: CO(直営店),LS(ライセンス店),JV(合弁事業店),FR(フランチャイズ店))ごとの分析,特定地域間の比較など,各自の観点でさらに分析を行い,考察をする.

<分析結果と考察>
・ここで,GDPに加えてコーヒー豆の消費量([4]参照)を,新たな関連要素として,データを読み込んで分析をした.
同じようにコロプレス地図を出力したところ,以下のようになった.

こちらのデータが,対象としている国が少なかったため,きちんとした相関は見て取ることができないが,あまり相関がないように見える.
相関がないように見える原因としては,コーヒー豆の消費量が多い国は,スターバックス以外にも他のチェーン店もあり,分散してしまうからではないかと考えた.

・次に,観光来訪者数を関連要素として考えた.同様にコロプレス地図を出力したところ,以下のようになった.

この地図もGDPの時と同様に,来訪者数が一定値(今回の規定値は,Visitors > 10,000)以上の国に絞ってもう一度出力すると,以下のようになった.

色の濃淡の具合が似ていることがわかるので,ここから来訪者数と人口10万人あたりの店舗数とは相関があるのではないかと考える.
しかし,GDPのコロプレス地図と見比べると,あまり関連がないように見えるので,GDPと来訪者数の関連度合いが違うのではないか.
ここで,来訪者数と関連がある理由について考える.来訪者数が多いということは,世界展開されているようなチェーン店があると,勝手がわかっているから安心するといった理由や,自国にはないような限定メニューを楽しみたいといった理由で,利用するのではないかと考える.

・また,糖尿病の割合も関連要素として考えた(データが2000年のものと2019年のしかなかったため,2019年のデータを採用している).同様にコロプレス地図に示すと,以下のようになる.

こちらも濃淡の具合が似ている.GDPや来訪者の時よりも,南アメリカやその他の細かい部分が似ている.
なぜ,糖尿病の人の割合が相関が見えるのか考えた.疑似相関の場合も,もちろん考えられるが,これはスターバックスの商品展開に関係があるのではないか.
スターバックスでは,もちろんコーヒーも売っているが,フラペチーノなどの商品も人気商品のうちの1つである.
フラペチーノは生クリームなどを使用しており,普段の食事にプラスして,糖質を過剰摂取する原因になっているのではないかと考える.
・しかし,これは店舗の立地を決める際に参考にするデータではなく,結果的にこのようなデータになったといったものなので,GDPや来訪者のデータとは捉え方が違うのではないか.


【参考文献】
[1] https://forbesjapan.com/articles/detail/15398 //スタバのジュース専門店「エボリューション・フレッシュ」、全店閉鎖へ
[2] https://investor.starbucks.com/press-releases/financial-releases/press-release-details/2021/Starbucks-Reports-Q2-Fiscal-2021-Results/default.aspx //Starbucks Reports Q2 Fiscal 2021 Results
[3] https://knoema.com/atlas/topics/Demographics/Population/Population?action=export&gadget=tranking-container //Total population
[4] https://www.ico.org/new_historical.asp //Historical Data on the Global Coffee Trade
[5] https://data.worldbank.org/indicator/NY.GDP.MKTP.CD // GDP [6] https://www.ico.org/trade_statistics.asp //Trade Statistics Tables [7] https://data.oecd.org // OECD data