【Airbnb】
部屋のレビュースコアを上げるには、どのようなアメニティを用意するべきか

◆概要・背景

Airbnbのレビュースコアとアメニティの関係を分析する。
というのも、Airbnbが提供するデータの中の“amenites”を利用して部屋ごとのアメニティの数を算出し、レビュー評価との関係をエラーバーを用いて確認したところ相関がある可能性が高いことがわかった。

Loading...

ちなみに線形回帰の結果は以下。p値も0に近いので相関している可能性はかなり高いと評価。coefficientは0.16なので、アメニティが1増えるとレビュースコアはおおよそ0.16点上がる傾向にあることがわかる。

Loading...

そこで、具体的にどのアメニティがレビュースコアとの関連性が高いのか、分析する。

◆課題

レビュースコアを上げるために効果的なアメニティを明確にする

◆分析の手順

① カンマ区切りの“amenities”を分割し、アメニティごとのカラムをlogical型で管理するように変換
② 各アメニティの項目をランダムフォレストにインプットし、関連性のありそうな項目を抽出する
③ 抽出した項目を説明変数に、レビュースコアを目的変数に設定して線形回帰を行い、関連性の高さを確認する
④ ③の評価をもとに、関連性の高い項目を考察する

◆分析内容

手順①
pythonを用いて実施。詳細は割愛。

手順②
データの偏りが9割を超えない特徴量に絞り、ランダムフォレストを実施した結果が以下である。なお、“wifi”は関係性が高そうなので偏りが9割を超えるもののインプットに設定。

Loading...

手順③
②のランダムフォレストの結果、confirmedと評価された特徴量に絞り、線形回帰を実施した結果が以下である。

Loading...

手順④
③の結果をもとに、
 ・wifi
 ・Laptop friendly workspace
 ・Dishes and silverware
 ・Iron
 ・TV
 ・Dryer
について、一つひとつ考察する。

◆アメニティごとの考察

wifi

部屋でwifiが利用できるかどうかを示す項目である。
③の線形回帰の結果をもとにすると、wifiが利用できる場合、できない場合に比べ1.87ポイント程度レビュースコアが高くなる傾向にある。
データに偏りがあるため信頼区間が大きくなってしまっているが、conf lowでも1.30ポイントと影響は大きそうである。

ここからは感覚的な推測だが、感覚的にwifiがあるからレビュースコアが上がるというよりは、wifiが無いことが不満に繋がるひとつの要因でありレビュースコアを下げているのでは無いかと考えられる。

Laptop friendly workspace

これはノートPCが使えるようなワークスペース(デスクなど)があるかどうかを示す項目である。
③の線形回帰の結果をもとにすると、ワークスペースがある場合、無い場合に比べ1.58ポイント程度レビュースコアが高くなる傾向にある。

これについては、
 ・民泊利用者(外国人が多い)はpc用のワークスペースを求める傾向にある
 ・その他の属性(部屋の広さなど)と因果関係がある
の2パターンが考えられる。1点目は今回のデータでは確認できないが、2点目に対してはwifiとの関連性が考えられるのでカイ二乗検定を実施してみた。

Loading...

wifiの偏りが大きいため確かでは無いが、p値がかなり小さいため関連性はありそうである。因果関係を考えると、「wifiがある⇨pc用スペースがある⇨レビュー評価が上がる」というよりは「pc用スペースがある⇨wifiがある⇨レビュー評価が上がる」という方が考えやすい。③の線形回帰ではlaptop friendly workspaceを除いた方が良かったのかもしれない。(ただ③の線形回帰の多重共線性は以下の通り低いため効果は相関は低いか?)

Loading...

Dishes and silverware

皿と銀食器が用意されているかどうかを示す項目である。
③の線形回帰の結果をもとにすると、食器がある場合、無い場合に比べ1.21ポイント程度レビュースコアが高くなる傾向にある。

理由は不明だがキッチンが存在するかどうかと関連がありそうなので、バーチャートを用いて確認。

Loading...

やはり、食器がある場合はキッチンがある確率が高い。②のランダムフォレストの結果からkitchenが落ちたのは、おそらくデータの偏りによる信頼区間の低下が原因であると思われる。

実際、線形回帰を“kitchen”単項目で説明変数に、レビュースコアを目的変数に設定して実施すると信頼区間は広いものの、p値は0に近く有意であると評価できる。

Loading...
すなわち、「食器がある⇨キッチンがある可能性が高い⇨レビュー評価が上がる」という因果関係が想定される。

Iron

アイロンが用意されているかどうかを示す項目である。
③の線形回帰の結果をもとにすると、アイロンがある場合、無い場合に比べ1.11ポイント程度レビュースコアが高くなる傾向にある。

これもレビュースコアと直接的な相関があるとは考えづらい。他の項目と因果関係が無いか確認するため、ironを目的変数に適当な項目を説明変数に設定してランダムフォレストを実行する。

Loading...

すると、“Firstaidkit”や“TV”などとの相関性がある。実際に“Firstaidkit”との関係性をバーチャートを用いて確認すると、確かに相関がありそうである。

Loading...

すなわち、アイロンがあることがレビュースコアに直結するわけではなく、アイロンがある場合、“Firstaidkit”のように他のアメニティも充実していることが多く、それらを介してレビュースコアに影響を与えているのでは無いかと考えられる。
そのため、 レビュースコアをあげるためにアイロンを用意する、という施策はおそらく効果がないのでは無いかと考えられる。

TV、Dryer

テレビと乾燥機だが、これらは外国人が好みそうなアメニティなのでレビュースコアに影響しているのではないかと思う。国にもよると思うが外国人は洗濯物を干さないイメージがある。

それぞれテレビがある場合は0.84ポイント、乾燥機がある場合は0.57ポイント程度、レビュースコアを上げる傾向にあることがわかる

◆結論

今回の分析を通じて、以下の結論が導かれた。

・wifiがあるとレビュースコアが1.87ポイント程度上がる傾向にある

・キッチンがあるとレビュースコアが3.7ポイント程度上がる傾向にある

・TVがあるとレビュースコアが0.84ポイント程度上がる傾向にある

・乾燥機があるとレビュースコアが0.57ポイント程度上がる傾向にある

・アイロンとpc用のワークスペースを用意することが有効かどうかは、他の特徴量との相関を更に分析する必要がある

◆今後

・例えば乾燥機の有無がレビュースコアの向上に繋がっているように、宿泊者の文化によって求められるアメニティも異なると考えられる。宿泊者リストなどから地域ごとに宿泊者の出身地傾向を分析し、その国の文化に応じたアメニティを用意するとレビュースコアの向上に繋がると考えられる。