時系列のデータを扱っていると、日付の値を切り捨てたいということがあります。例えば、別のデータフレームは月単位で、もう片方のデータは日単位だった時に、結合をする際に日付の単位を揃えたいといったこともあります。
今回は、日付の値を切り捨てて、月初に揃える方法について紹介します。
1行が1日単位の売上データを使用します。注目する列は「注文日」という日付型の列です。
「注文日」列のヘッダーメニューから「丸め処理」を選択し、「月」を選びます。
今回は、丸め処理でよく使用される以下の3つのオプションについて紹介をしていきます。
列のヘッダーメニューから「丸め処理」の「月」を選び、「日付の切り捨て」を選択します。
切り捨ての時に計算エディタに表示される関数は floor_date関数です。単位(unit)は "month" に設定されていることを確認して実行します。
これにより切り捨て処理が行われ、全ての日付がその月の1日に揃えられます。
列のヘッダーメニューから「丸め処理」の「月」を選び、「日付の切り上げ」を選択します。
切り上げの時に計算エディタには ceiling_date関数が使用されます。
切り上げの処理では、全ての日付が次の月の1日に切り上げられます。
列のヘッダーメニューから「丸め処理」の「月」を選び、「日付の丸め」を選択します。
丸目処理の時の計算エディタには、round_date関数が使用されます。
丸め処理では、月の中間日(例:1月16日)を基準に前後の月初に丸められます。月の前半は当月1日に、後半は翌月1日に丸められるようになっています。月によって中間日が異なる場合があります。
今回は、日付の丸め処理として「切り捨て」、「切り上げ」、「丸め」の3つを紹介いたしました。多くの場合、月初に揃える「切り捨て」処理が一般的に使用されますが、分析の目的に応じて、最適な丸め処理を選択してみてください。