和暦を西暦に変換する

日本語データによくありがちな問題を解決するために超便利なzipanguというRのパッケージがあります。

これはRの世界ではすごくわかりやすいHow-to記事や本などを書くことでも有名な瓜生さんが作られたパッケージで、Exploratoryのデフォルトでインストールされるパッケージとしてサポートしており、UIを通して簡単に実行できるようになっています。

いろんなことができますが、特に以下のようなオペレーションは特に便利です。

  • 和暦を西暦に変換
  • 日本の祝日かどうか判定 - リンク
  • ひらがな、カタカナの変換
  • 全角、半角の変換 - リンク
  • 漢数字と数字の変換 - リンク
  • 日本の住所の分割 - リンク

今回はその中でも「日本の和暦を西暦に変換」する方法を紹介します。

和暦の年(令和4年)を西暦の年(2022)に変換

ここでは、東京都の転入者数に関するデータを使用していきます。

データの中には「和暦」の列があり、「昭和29年」のようになっていますが、これを「西暦」に変換していきたいです。

和暦の列ヘッダメニューから「テキストデータの加工」を選び、「変換する」から「和暦の年 / 西暦の年」を選択します。

テキストを変換のダイアログが表示され、変換タイプには「年(和暦 )/ 年(西暦)」が選択されています。

プレビューをクリックすると、新しい値にて「西暦」の値に変換されていることが確認できます。

今回は結果の比較を行いたいため、新しく列を作成にチェックをつけ、列名に「西暦」を指定して実行します。

もし、そのままの列を上書きしたい場合は「対象の列を上書き」を選択ください。

これによって和暦(例: 昭和29年)を西暦(1954)に変換することができました。

和暦(令和4年1月1日)を西暦(2022-01-01)に変換

次は、年月ごとの売上や顧客数に関するデータを使用していきます。

データの中には「和暦」の列があり、「平成29年1月1日」になっていますが、これを「西暦」に変換し、「2017-01-01」のような日付型にしたいです。

日付の列ヘッダメニューから「テキストデータの加工」を選び、「変換する」から「和暦 / 西暦」を選択します。

テキストを変換のダイアログが表示され、変換タイプには「和暦 / 西暦」が選択されています。

プレビューをクリックすると、新しい値にて「和暦」の部分が「西暦」の値に変換され、「2020-10-01」といった値になっていることが確認できます。

結果を比較したいため、新しく列を作成にチェックをつけ、列名に「西暦」を指定して実行します。

これによって和暦(例: 平成29年1月1日)を西暦(例: 2017-01-01)に変換し、日付型のデータにすることができました。

参考資料

  • Exploratoryを日本語環境で使う際のベストプラクティス - リンク
  • 日本の祝日かどうか判定 - リンク
  • 全角、半角の変換 - リンク
  • 漢数字と数字の変換 - リンク
  • 日本の住所の分割 - リンク
Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio