レコメンドシステムの落とし穴 Part 2 - 「好み」の操作と正当化

私達が日常使うAmazonやYoutubeといったサービスでもレコメンドされてくるコンテンツはたくさんありますが、その中でもほんとうにクリックしたいと思うもの、さらにクリックした後に、クリックしてよかったと思うものは案外少ないといったことはないでしょうか。

現在のようなビッグデータとかAIの時代には、大量のデータを使ってレコメンドエンジンや予測モデルを作れば、ユーザーや顧客が欲しい物を正確に推奨または予測できると思いがちですが、実はユーザーの「好み」を正確に理解するのは思ったより難しいものです。

そこで、このユーザーの「好み」とは何か、どうしたらより正確に知れるのかというテーマでこのシリーズを始めましたが、今回はそのPart 2となります。

前回のPart 1では、「好み」とは何か、選択と幸福と何が違うのかというのを見てきました。

今回のPart 2では、このユーザーの「好み」そのものも必ずしもいつも同じであるとは限らず、実は「好み」がその場の状況によって動的に作られることがあり、それは簡単に外部によって操作されることもあるという話を紹介します。

このシリーズのもとになっているのは、ユーザーの「好み」と「選択」の関係を整理し、さらに「好み」に影響を与えるユーザーの「幸福」や「価値観」との関係を整理し、さらにユーザーの「好み」をより正確につかむために何ができるのかをまとめた「What Does it Mean to Give Someone What They Want? The Nature of Preferences in Recommender Systems」という素晴らしい記事です。

以下、要約。

「好み」とは何なのか理解しようとすればするほどレコメンド・システムは「複雑さ」の穴に落ちていきます。「選択」は人々が何を重要としているのかを知るために使える最も適した道具のようです。しかし、これまで見てきたようにそれは必ずしもユーザーにとってほんとうに重要なこと、意味のあることを反映しているとは言えなさそうです。

そこで「選択」ではなく、「好み」に最適化する方がよさそうなのですが、もちろんそれは「好み」を知ることができるということが前提となります。というのも、これまで見てきたように「好み」自体も実は分かっているようで分かっていないものなのです。

全ての「好み」と「選択」はいつもその場で形成されると主張する学者もいます。例えば、「The Mind is Flat (2018)」という本の中でNick Chaterは、全ての人の考えと行動は、それまでの過去や状況に合うようにその場でアドリブのように形成されるものだと主張します。

私達の定義する「判断」とは私達が選択をしようとする過程で行われるいくつかの相対的な比較のことを意味します。

例えば、Youtubeでレコメンドされる一連のビデオを選択するとき、私達はそれらの関連性やタイミング、事実性、ビデオ制作のクオリティ、長さ、オリジナリティ、自分の持つセルフイメージとの一貫性、などといったいくつもの比較的判断を頭の中で、または無意識のうちに行います。そうしたいくつかの属性について、どれがより重要なのかといったトレードオフについての判断をするのです。

「好み」とはこうした一連の判断を意味します。さらにもっと言うなら、「好み」とはどういう行動をとったかではなく、こうした選択を行うために頭の中で行う理由付けでもあるのです。

私達は多様な方法でその場その場での思いつきで「好み」を構築するため、それらの好みには一貫性がなく、それらは変わりやすく、私達の知らない要因によって左右されてしまうことがよくあります。例えば、ダニエル・カーニマンとアモス・トベルスキーによる人間の意思決定に関する研究によると、同じ質問だが違う言葉を使って「好み」に関して質問すると、多くの場合人々は矛盾する答えを返すとのことです。

これは、レコメンド・システム自体が私達の「好み」の形成そのものに影響を与えるということを意味します。

例えばポジション・バイアスというのがあります。レコメンドされたコンテンツが並ぶリストの最上位に表示されるものは「より目に付く」という事実自体が、ユーザーの「好み」に影響を与えるというものです。

UIをどうデザインするかにあたっての様々な選択が「好み」の形成に影響を与えるのです。例えば、あるコンテンツの作者の評判がどう表示されるか（人気を示す数字、「有名な出版会社」といったようなラベル、ファクト・チェック、など）、コンテンツのどういった属性をより目に付きやすくするか、どのように整理して表示するか（ネットフリックスのカテゴリー分けなど）、などといったもの全てがユーザーの「好み」の形成に程度の差はあれ、何らかの影響を及ぼすのです。

私がここで言いたいのは、A/Bテストをする、人々が何をするか観察する（アクティビティのデータを取る）、様々な方法でユーザーに何が欲しいのかを聞く、といったことをしてもまったく意味がないということではありません。

それらは多くの場合、ユーザーが何を望むかを理解する上で実際役に立ちます。

エンゲージメントに関する簡単な最適化をすれば、多くの場合いい効果を得られます。というのも、レコメンドエンジンに何かをレコメンドしたときに一般的なユーザーが下す「選択」は、多くの場合ユーザーの「好み」や「価値観」を反映しているからです。

Netflixの場合、途中で見るのをやめてしまった映画よりも、最後まで見た映画のほうが、ユーザーはより満足しているでしょう。

Twitterで単にスクロールしてスキップしたツイートよりも、一度止まって「ライク」ボタンを押したツイートのほうが、ユーザーはより高い満足感を覚えるでしょう。

Amazonで同じような値段だが買わなかったものよりも、実際に購買に至った商品のほうが、ユーザーの「好み」をより反映していると言えるでしょう。

ユーザーの下す「選択」は多くの場合ユーザーの「好み」の鏡なのです。ただ、いつもそうとは限らないということです。

ここで、テック業界で有名な伝説的投資家ジョン・ドアーの過去のコメントを紹介したいと思います。これは、ビデオを見る「時間」と「選択」を元にしたエンゲージメント指標をユーザーの「幸福」と同じものとして捉えてしまっているいい例です。

「あるユーザーがYoutubeに行って「ネクタイをどう結べばよいか」と検索した。これに関して２つのビデオがある。１つ目は１分のビデオで素早く正確にどうやってネクタイを結ぶかを教えてくれるものだ。２つ目のビデオは10分の長さだが、ジョークが散りばめられてあり、見ててとても面白いものだが、最後まで見ても実際ネクタイをちゃんと結べるようになったかどうかはよくわからないというものだ。それでは、どっちのビデオを検索結果のリストの最初に表示するべきだろうか？

私であれば2番目のビデオを最初に出したい。視聴者は10分のビデオの7分を見ているときの方が、1分のビデオの全てを見るよりも、より幸せなもので、彼らが幸せなら私達も幸せなのだ。」（John Doerr, Measure What Matters, 2018）

なぜ、「選択」、「好み」、そして「幸福」はよくごちゃ混ぜになってわけわからなくなってしまうのでしょうか。

まず最初に考えられるのは現実的な理由です。というのも、行動（アクティビティ）に関するデータはいくらでもあり、簡単に取れるため、エンゲージメント、つまり行動に最適化する方がより簡単だからです。「明らかにされる好み」のパラダイムはこのアプローチを正当化します。そこで、エンゲージメントはユーザーにとっての幸福と強く相関すると主張することになるのです。こうした主張を信じることは便利です。というのも、人々が持っている「利他の精神」と「自分の利益を求める態度」の両方を同時に満たすことができるからです。

このことに関して、Nick Seaverは「Captivating algorithms: Recommender systems as traps (2018)」（リンク）という研究論文の中で次のように述べています。

「作られた満足感とリテンションの関係は、ユーザーのためになることをしたいと強く思うことが多いエンジニアと、ユーザーのエンゲージメントを上げて利益を上げることを願うビジネスサイドの人達の間に発生する緊張を和らげることになります。「ユーザーの満足」という言葉を使ってアピールするのはソフトウェア業界ではモラル（道徳心）の力を持ち、技術的なことに関する様々な決定を正当化できるようになります。しかし、これはテクノロジーによる魔法、人々が望み楽しむ魔法といったものに対し、根本的なレベルで何か落ち着かない気持ちを抱かせます。ユーザーを満足させることとユーザーを取り込むことの間にある緊張はそんなに簡単に解決されるものではありません。しかし、音楽ストリーミングサービスを提供する企業で働く人は、リスナーのためになることと、リスナーを中毒にすることの両方同時を満たすために自分は働いてるんだと、何の恥じらいもなく私に面と向かって言うことができるのです。」

要約、終わり。

あとがき

「好み」がその場その場で構成されるというのは、「好み」を理解する上で重要な点ですね。

1950年代頃に、精神学者フロイドの甥にあたるEdward Bernaysが作った広告会社が行ったキャンペーンの1つにタバコの市場を拡大するために女性たちにタバコを「女性の独立」、「自由な女性」の象徴として訴え始めるというのがありました。

当時これから社会（またはビジネス）に積極的に進出していくことになる女性をターゲットにしたキャンペーンでしたが、それまでタバコは男性のもので、ワイルド、強さ、または野蛮でガサツと言ったイメージが強く、女性が手を出すものではないとされていたものが、急に多くの女性達の間に広まっていきました。

これなどは「好み」が簡単に操作される例と言えるでしょう。プロパガンダとはそういう大衆の「好み」を洗脳するものですし、コカ・コーラに代表される広告というのも「好み」を刷り込むものです。

それだけに、ユーザーが欲しい物を理解し、それを提供するレコメンドのシステムを作るときに気をつけなくてはいけないのは、自分達がユーザーの「欲しい物」を操作しているにも関わらず、ユーザーが「何を欲しいのか」を理解しようとしている、といった「無限ループ」に陥ってしまっているかもしれないということです。

短期的にはユーザーの好みを操ったり、作られた満足感を提供したりすることができるかもしれません。しかし、長期的にはほんとうにユーザーが自分の時間やお金を費やすに値する価値を見出せるサービスを提供できているのか、そういう意味で役立つレコメンドができているのか、といったことこそが自分たちのビジネスにとっても重要になってきます。

それだけに、視聴時間が長いからエンゲージメントが高く、それはユーザーにとってもいいことだ、といった自分たちに都合のいい解釈を信じ込み、ユーザーだけでなく自分たちをも騙してしまうことのないように気をつけなくてはいけませんね。

今回は以上となります。

次回はいよいよ最終回となりますが、それでは、どのように「好み」を理解していけばよいのかについてです。

データサイエンス・ブートキャンプ・トレーニング

データサイエンス、統計の手法、データ分析を1から体系的に学ぶことで、ビジネスの現場で使える実践的なスキルを身につけたいという方は、ぜひこの機会に参加をご検討ください！

ビジネスのデータ分析だけでなく、日常生活やキャリア構築にも役立つデータリテラシー、そして「よりよい意思決定」をしていくために必要になるデータをもとにした科学的思考もいっしょに身につけていただけるトレーニングとなっています。

詳細を見る