Exploratoryでは、「開始時期」「終了時期」「生存状態(例: キャンセル、退職、死亡)」の列を持つ、1行1観察対象(例: 顧客、従業員、患者)のデータがあれば、生存曲線の実行が可能です。(生存曲線の詳細はこちらからご確認ください)
また、Exploratoryの生存曲線では、「終了時期」に選択した列に欠損値がある場合、欠損値を「データ上の最後の日」で自動的に補完して、生存曲線を実行します。
これは、「生存状態」のイベント(例: キャンセル、退職、死亡など)が発生していない場合、「終了時期」にデータが入っていないことが多いためです。
通常、このような欠損値の補完が問題になることはありません。
しかし、例えば、「終了時期」のデータに誤って未来のデータが含まれてしまった場合や、サブスクリプション型のビジネスで複数年のライセンスを購入しており、未来の契約終了日が「終了時期」に入っている場合、「終了時期」が欠損値の観察対象の「終了時期」が、「データ上の最新日時」で埋められてしまうことで、(実際はそこまで生存しているかどうかはわからないにも関わらず)その未来まで生存していることになってしまいます。
結果として、そのようなデータを使って生存分析を実行すると、打ち切り(その生存期間までのデータがなく、生存曲線の計算対象から除かれる観察対象)が「0」ばかりになってしまうことがあります。
こういったときには、「終了時期」が欠損値の場合、「データ上の最新の日」ではなく、「今日」あるいは「任意の日付」で埋めたいことがあるわけです。
生存曲線の「終了時期」を「今日」または「指定した値」で埋めるには、生存曲線の設定を開きます。
設定のダイアログが開いたら、「終了時期の欠損値(NA)を埋める」メニューから、「今日」または「日時を指定」を選択します。
「日時を指定」を選択したときには、欠損値を埋める「日時」の直接指定します。
なお、生存曲線の設定メニューから、終了時期の欠損値を埋める方法を今回は紹介しましたが、「欠損値の加工」等のメニューからあらかじめ、欠損値を埋めるステップを追加して手元のデータの欠損値を直接埋めることも可能です。