こんにちは
Exploratoryの白戸です。
前回は、ヒートマップを使用してカテゴリー間の組み合わせごとに集計した数値を色で表示していきました。
今回はヒートマップに繰り返しをすることで、下記のようにOSごとにヒートマップを可視化していきます。
目的
使用機能
前回も使用した、activitiesというアクセスログのデータを使用します。このデータの取得とインポートはこちらの記事にあります。
また今回は、このデータフレームのラングリングの3番目のステップを使用するので、チャートが正しく3番目のステップに「ピン」されていることを確認してください。
もし、ステップのピンの変更方法がわからない場合は前回の記事を参照してください。
繰り返しまでは、前回の曜日と時間毎のユーザー数のヒートマップと同様ですので、すでにご覧になられた方は繰り返しから読み進めてください。
新しくチャートを作り、「ヒートマップ」を選択します。
曜日ごとにデータを見ていきたいので、X軸にtimestampを選び、「曜日 - ショート(月)」を選択します。
次に、1日の時間ごとにデータを見ていきたいので、Y軸も同様に、timestampを選び、「時」を選択してください。
今回は、ユーザー数の傾向を色を使用して可視化していきます。
そこで、「色で分割」に「userid」を選びます。
曜日と時間毎のユーザーが何人いるかを見たいため、集計関数は「一意な数(UNQ)」を選びましょう。
曜日と時間毎のユーザー数を色を使用して可視化することができました。
次に、繰り返しを使用してOS別に見ていきます。
繰り返しにOSを選択します。
OS別にヒートマップを可視化することができました。
Linuxは数が少ないため、全て青で表示されていてみづらいです。
そのため、フィルタ機能を使用してLinuxを非表示にしていきます。
チャート上部にあるフィルタをクリックし、列にOSを選び、演算子を等しくないにして、値はLinuxを選択して実行します。
MacとWindowsのみを表示することができました。
どちらも土曜日と日曜日はユーザー数が少ないようです。 また、時間によるユーザー数の違いは多少見られますが、どちらも火曜日から木曜日にかけてユーザー数が多いことがわかります。
今回はヒートマップと繰り返しを使用して、カテゴリー間の組み合わせをOSごとに集計して、数値を色で可視化していきました。
2つのカテゴリーの組み合わせを見たいときに便利なのが、ヒートマップというチャートです。ヒートマップは細かなデータを見ることはできませんが、規則性の発見などに役立ちます。
次回から、散布図を使用していきます。 散布図は、X軸とY軸に対応する位置にデータを点でプロットします。それにより、データのばらつきや関係性を見ることができるチャートです。
可視化シリーズ 第13弾 - 散布図を使って2つの数値データの関係を可視化する
Exploratoryでは7月に、データサイエンスの手法をプログラミングすることなしに基礎から体系的に学び、 それを実際の業務で使えるレベルのスキルを身につけていただくことを目的とした 3日間コースのトレーニングを平日版と週末版で開催します。
詳しくはこちらのページをご覧ください。
データを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください!