複数の区切り文字をもとに、列に分割したい

データに含まれる情報が単一の区切り文字ではなく、複数の区切り文字で区切られている場合があります。Exploratoryでは、正規表現を使用することで、複数の区切り文字を指定して列を分割することができます。

役立つ人

Webサービスのログデータを扱う方、複雑な区切り文字を含むデータを整理したい方にお役立ていただける機能です。

問題

データの中に複数の区切り文字が混在している場合、単一の区切り文字では適切に列を分割することができません。例えば、イベントの種類によって区切り文字がハイフン(-)だったりアンダースコア(_)だったりする場合、単純な列分割では欠損値が発生してしまいます。

解決方法

複数の区切り文字を指定するには、カスタム区切り文字と正規表現の機能を組み合わせます。

正規表現の論理演算子である|を使用することで、「〜または〜」という条件を指定でき、複数の区切り文字に対応した列分割が可能になります。なお正規表現では[]で文字列を囲うことでも同じように条件の指定が可能です。

ノート形式で詳しいやり方を知りたい方はこちらのノートをご参考ください。

ビデオ

参考情報

  • Excel シリーズ: 値を行に分割する方法 - リンク
  • Excel シリーズ: 値を分割して複数の列を作る方法 - リンク
Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio