時間ごと(0~23時)に列がある時系列データをチャートで可視化する方法

今回は、あるサービスの利用者数のデータを使用します。

このデータは1行が1日で、時間ごとに列があるデータです。

今回やりたいこととしては、ラインチャートを使って時間ごとのユーザー数の推移を可視化したいです。

そのため、ラインチャートを使ってX軸に時間の列を割り当てたいのですが、一つの列しか選ぶことができません。

X軸に全ての時間の列を割り当てるには、どうしたらよいのでしょうか。

まず、このデータは時間ごとに列がある横長のデータで、このことを「ワイド型」と言います。

次に、値の列が一列にまとまっている縦長のデータのことを「ロング型」と言います。

ロング型のデータにすることで、X軸に時間の列を割り当てることができ、チャートで可視化しやすくなります。

そのため、ワイド型からロング型のデータに変換していきます。

時間ごとに分かれている列をShiftキーを押しながら複数選択します。

次に、列ヘッダメニューからワイド型からロング型へ(Gather) を選び、選択された範囲を選択します。

ワイド型からロング型へのダイアログが表示されます。

開始に0時の列を、末尾に23時の列を選択します。

キー列と値の列に任意の名前を入力します。

実行するとワイド型からロング型へ変換されました。

チャートに戻り、チャートピンを最新のステップに紐付けます。

X軸に時間の列(hour) を、Y軸にユーザー数(value) の列を選び、集計関数に平均値を選択します。

ユーザーの利用時間の推移を可視化することができました。

ユーザーの利用時間は9時から20時までがよく使用されるようです。

色に日付(Date) の列を選び、集計単位に丸め処理の月を選択します。

月ごとにユーザーの利用時間の推移を可視化することができました。

どの月でもユーザーの利用時間には同じような傾向があることがわかります。