日本語データによくありがちな問題を解決するために超便利なzipanguというRのパッケージがあります。
これはRの世界ではすごくわかりやすいHow-to記事や本などを書くことでも有名な瓜生さんが作られたパッケージで、Exploratoryのデフォルトでインストールされるパッケージとしてサポートしており、UIを通して簡単に実行できるようになっています。
いろんなことができますが、特に以下のようなオペレーションは特に便利です。
今回はその中でも「日本の和暦を西暦に変換」する方法を紹介します。
ここでは、東京都の転入者数に関するデータを使用していきます。
データの中には「和暦」の列があり、「昭和29年」のようになっていますが、これを「西暦」に変換していきたいです。
和暦の列ヘッダメニューから「テキストデータの加工」を選び、「変換する」から「和暦の年 / 西暦の年」を選択します。
テキストを変換のダイアログが表示され、変換タイプには「年(和暦 )/ 年(西暦)」が選択されています。
プレビューをクリックすると、新しい値にて「西暦」の値に変換されていることが確認できます。
今回は結果の比較を行いたいため、新しく列を作成にチェックをつけ、列名に「西暦」を指定して実行します。
もし、そのままの列を上書きしたい場合は「対象の列を上書き」を選択ください。
これによって和暦(例: 昭和29年)を西暦(1954)に変換することができました。
次は、年月ごとの売上や顧客数に関するデータを使用していきます。
データの中には「和暦」の列があり、「平成29年1月1日」になっていますが、これを「西暦」に変換し、「2017-01-01」のような日付型にしたいです。
日付の列ヘッダメニューから「テキストデータの加工」を選び、「変換する」から「和暦 / 西暦」を選択します。
テキストを変換のダイアログが表示され、変換タイプには「和暦 / 西暦」が選択されています。
プレビューをクリックすると、新しい値にて「和暦」の部分が「西暦」の値に変換され、「2020-10-01」といった値になっていることが確認できます。
結果を比較したいため、新しく列を作成にチェックをつけ、列名に「西暦」を指定して実行します。
これによって和暦(例: 平成29年1月1日)を西暦(例: 2017-01-01)に変換し、日付型のデータにすることができました。