
データに含まれる情報が単一の区切り文字ではなく、複数の区切り文字で区切られている場合があります。Exploratoryでは、正規表現を使用することで、複数の区切り文字を指定して列を分割することができます。
Webサービスのログデータを扱う方、複雑な区切り文字を含むデータを整理したい方にお役立ていただける機能です。
データの中に複数の区切り文字が混在している場合、単一の区切り文字では適切に列を分割することができません。例えば、イベントの種類によって区切り文字がハイフン(-)だったりアンダースコア(_)だったりする場合、単純な列分割では欠損値が発生してしまいます。

複数の区切り文字を指定するには、カスタム区切り文字と正規表現の機能を組み合わせます。
正規表現の論理演算子である|を使用することで、「〜または〜」という条件を指定でき、複数の区切り文字に対応した列分割が可能になります。なお正規表現では[]で文字列を囲うことでも同じように条件の指定が可能です。

ノート形式で詳しいやり方を知りたい方はこちらのノートをご参考ください。