イベント発生時のみに値が記録された列をロジカル型に変換する方法

従業員の離職データなどで、離職している場合のみに「1」が記録され、離職していない場合には欠損値となっているようなデータを扱うことはよくあります。

このようなデータを使って、離職に関する予測モデルを構築したり、離職している従業員の割合を計算したりするには、TRUE/FALSEの二値を持つロジカル型にデータが変換されている方が都合がいいことがあります。

そこで、こちらのノートでは、イベント発生時のみに「1」という値が記録された列をロジカル型に変換する方法を紹介します。

まず離職列を数値型からロジカル型に変換します。

「離職」列のヘッダーメニューから「データタイプを変換」を選択し、「ロジカル型に変換」を選択します。

データ型変換のダイアログが表示されたら、そのまま実行ボタンをクリックします。

これにより、もともと「1」という値が入っていた行はTRUEに変換されました。

ただし、現状では「1」だった箇所がTRUEになっただけで、FALSEは0件、それ以外は欠損値のままとなっています。

今回、離職していない従業員の欠損値は、実質的にFALSEに該当するため、これをFALSEに変換します。

改めて離職列のヘッダーメニューをクリックし、「欠損値の加工」から「欠損値(NA)をFALSEで埋める」を選択します。

サブメニューの中から計算を作成のダイアログが表示されたら、impute_na()という欠損値を補完するための関数の中で、欠損値をFALSEという形で埋める数式がすでに入力されていることを確認し、そのまま実行ボタンをクリックします。

これで欠損値だった箇所にFALSEが入り、離職列が全てTRUEとFALSEの二値のみを取る、欠損値を含まないロジカル型の列に変換できました。

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio