生存曲線を作成した際に生存期間がマイナスから始まってしまう問題の解決方法について説明いたします。
Exploratoryでは、カプランマイヤー法を使用した生存曲線を作成できますが、生存曲線を作成する際、生存期間は通常ゼロから始まるべきですが、マイナスから始まってしまう場合があります。
この問題は終了時期が開始時期よりも前に設定されているため、各観察対象の生存期間がマイナスになってしまう現象によって生じています。
解決方法として最も一般的なものは、不備のあるデータを修正する、または除去することです。
また不備のあるデータを特定したい場合は、開始日と終了日の差を算出して生存期間を計算します。
生存期間を計算したいときには、開始日と終了日の列を選択した状態で、列ヘッダーメニューから、「期間」の「日数」を選択します。
計算を作成のダイアログが開いたら、days_between(開始日, 終了日)
の順番になっていることを確認したら、任意の列名を指定して実行ボタンをクリックします。
生存期間の列を追加できました。
生存期間の計算が完了したら、期間がマイナスのデータが不備のあるデータとなります。
該当するデータを除去したい場合は、フィルタ機能を使用して生存期間が正の値となるような条件を設定することで、不備のあるデータを除去できます。