EDA Salon 第8回 - YouTubeのトレンディングデータ

今月のデータは、世界最大の動画共有プラットフォームのYouTubeのデータです。

データ

※ データに重複した行が存在していたため、下記のデータは修正版となります。

データはこちらからダウンロードしてください。

もしくは、データカタログを使って簡単にインポートすることができます。

このデータはKaggleで公開されているYouTubeのトレンディングデータから日本とアメリカのデータをマージ(行結合)して、可視化やアナリティクスに使いやすいように加工したデータです。

それぞれの列の説明はMetadataにある、「Data Dictionary」から見ることができます!

サンプルの質問

データを探索的に分析するにあたって、最初に設定する質問は自分が興味のある質問を設定してみてください。

もし、どういった質問をすればいいのかわからない場合は、以下の質問を参考にしてみてください。

  • ビュー数が多い動画の特徴は何か?
  • 評価が高いまたは低い動画に特徴はあるか?
  • 日本とアメリカでビュー数またはトレンド件数にカテゴリーの違いはあるか?

EDA Salonへの参加方法

Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!

EDA Salonへの参加方法の詳細は下記をご覧ください。

Exploratoryをまだ持っていない方

Exploratoryをまだお持ちでない方は、フルバージョンを30日間の無料トライアルで試すか、パブリックバージョン(Exploratory Public)を無料で使うことができるのでぜひサインアップしてみてください。