このノートでは、日本語の文字列のみをデータとして残すための方法について紹介します。
使用するデータは1行が1注文のような売上のデータを使用していきます。
顧客名の列をみると、日本語(ひらがな、カタカナ、漢字)以外の文字も含まれますが、日本語の名前の人のみをデータとして残したいとします。
顧客名の列ヘッダメニューから「フィルタ」を選び、「この文字列を含む」を選択します。
フィルタのダイアログが表示されるため、「正規表現として扱う」にチェックをつけます。
次に、値には下記の正規表現を入力します。
[\p{Hiragana}\p{Katakana}\p{Han}]
それぞれは、Unicodeで表現した際に、以下のような意味となります。
フィルタを実行することで、顧客名にある日本語の文字の人のみをフィルタで残すことができました。