このノートでは、時系列予測(Prophet)アナリティクス・ビューの各アナリティクス・プロパティについて解説します。

これらのプロパティは、こちらの歯車アイコンをクリックすると表示されるダイアログ内で指定できます。

アナリティクス・プロパティ

予測期間

予測する期間の長さを指定します。

例えば、日付/時間の列月に切り捨てが指定してあるときに、10が指定されると、10ヶ月分の予測が行われます。

不確実性区間

不確実性区間とは、予測結果のラインの周りに表示される薄いオレンジ色のエリアのことですが、ここに指定する確率で、データがその中に収まるような不確実性区間が計算されます。例えば、デフォルトの0.80は、80%の確率でデータが収まるような不確実区間を計算する、という意味になります。

ただし、不確実性区間は、トレンドの変化の大きさと頻度、さらにノイズの大きさが、将来にわたって過去のデータと同じであるという仮定の下で計算されるため、ここで指定されるのは、この仮定のもとでの確率であることには注意が必要です。

不確実性区間のためのシミュレーション

不確実性区間を計算するために行われるシミュレーションの回数を指定できます。

季節性

年周期の季節性

年周期の季節性を考慮した予測をするかどうかを指定します。

デフォルトのAutoでは、データの長さが2年以上あるかによって年収期の季節性が考慮されるかどうかが決まります。2年より短いデータでは、年収期で繰り返す季節性があるかどうか判断する根拠に乏しいと判断され、年収期の季節性を考慮しない予測となります。

週周期の季節性

週周期の季節性、つまり曜日によるトレンドを考慮した予測をするかどうかを指定します。

デフォルトのAutoでは、データの長さが2週間以上あって、日付/時間の列に指定された単位が日に切り捨てより細かいときのみ週周期の季節性が考慮されます。

日周期の季節性

週周期の季節性、つまり一日の中の時間によるトレンドを考慮した予測をするかどうかを指定します。

デフォルトのAutoでは、データの長さが2日間以上あって、日付/時間の列に指定された単位が時に切り捨てより細かいときのみ日周期の季節性が考慮されます。

季節性の程度

季節性を予測にどの程度取り入れるかを、ここに指定する数値で調整出来ます。

値が大きいほど、大きな季節性があるときもそれに追随した予測が行われます。値が小さいと、季節性の効果を小さく見積もった予測が行われます。

季節性のモード

季節性の影響が加法的なものか乗法的なものかを選択できます。 ここで指定するオプションによって、季節性のみでなく、祝日効果、外部予測変数の影響が加法的なものか乗法的なものかも決まります。

祝日効果

祝日効果の程度

祝日効果を予測にどの程度取り入れるかを、ここに指定する数値で調整出来ます。

値が大きいほど、祝日効果を重視した予測が行われます。値が小さいと、祝日効果を小さく見積もった予測が行われます。

国の祝日情報を使用

国の祝日情報を使用した予測を行う場合、ここにその国の国コードを指定します。カンマ区切りで複数の国を指定することもできます。

サポートされている国とそのコードの一覧はこちらです。

トレンドのリミット

予測において、現実的にあり得る上限値、下限値を指定できます。

指定した場合、トレンドには直線の代わりに、指定された上限値、下限値で飽和するロジスティック曲線が使用されます。

チェンジポイント

トレンドが変化するタイミングを、チェンジポイントと呼びます。 チェンジポイントの詳細についてはこちらに解説があります。

チェンジポイントの期間 (割合)

予測を安定させるために、Prophetは、デフォルトで入力時系列データの始めの80%の区間内のみでチェンジポイントを検出しようとしますが、この割合を、ここで80%以外の値に設定することができます。

チェンジポイントの数

チェンジポイントの候補となる点の数はデフォルトで25個ですが、この値をここで変更することができます。

チェンジポイントの柔軟性

チェンジポイントにおいて、トレンドの直線(またはロジスティック曲線)をどれだけ柔軟に折り曲げるかを指定することができます。

チェンジポイント

上記のように、Prophetは自動的にチェンジポイントを検出して予測モデルに組み込みますが、そのチェンジポイントの候補となる日時を自動で決めるのではなく、ここで指定することも出来ます。

ベイズ推定

MCMCサンプル数

0(デフォルト)が指定されたときは、MCMCサンプリングによる推定を行うのではなくMAP推定という手法でモデルが構築されます。

0以外の数値が指定されたときは、そのサンプル数を用いたMCMCサンプリングによる推定でモデルが構築されます。この場合はMAP推定よりも計算量が増えるため、モデルの構築に時間がかかることがあります。

データの前処理

値の列に値がないときの処理

“値の列”の値がない区間があるときに、どのように処理するかを以下の中から指定します。

  • 埋めない
  • 前の値で埋める
  • ゼロで埋める
  • 線形補間
  • スプライン補間

外部予測変数に値がないときの処理

外部予測変数が指定されたとき、その値がない区間があるときに、どのように処理するかを以下の中から指定します。

  • 埋めない
  • 前の値で埋める
  • ゼロで埋める
  • 線形補間
  • スプライン補間

検証

テストモード

TRUEがセットされると、テストモードが有効化されます。

テストモードでは、入力時系列データの最後の部分のデータを予測のための学習に使用せず、あとで予測の正確さをテストするためにとっておきます。そして、このとっておいたテストデータでテストした結果が表示されます。

テストデータの期間

テストデータとして使用する、入力時系列データの最後の部分の長さを指定します。