zipanguを使って住所を分割する方法

今回はExploratoryでzipanguを使って住所を分割する方法を紹介します。

日本の住所は都道府県や市区町村で分けるのが難しく、例えば北海道にある"北海道余市郡余市町朝日町"という地域は「市」や「町」が複数あるため簡単に分けることができません。

そこで、この問題を簡単に解決してくれるのがUryuさんが開発したzipanguというRパッケージです。

それでは、Exploratoryでzipanguを使って住所を分割していきましょう!

zipanguパッケージをExploratoryにインポートする

プロジェクトレベルのメニューから、「R パッケージの管理」を選ぶと、パッケージをインストールすることができるダイアログがでてきます。

「パッケージをインストール」のタブを選んで、「zipangu」とタイプして、「インストール」ボタンを押します。

インストールが終わると、「zipangu」が「インストール済みのパッケージ」のリストに入っており、さらにチェックされてます。ここでチェックされていると、そのパッケージの関数をそのまま使うことができるということです。

zipanguの関数を使って日本の住所を分割する

今回はAirbnbの東京の宿泊施設データを使用します。

"東京都西東京市南町1丁目12"といった住所があった時に、これを"東京都", "西東京市", "南町1丁目12"のように分けたいとします。

住所の列ヘッダメニューから計算を作成をクリックします。

計算を作成のダイアログが表示されます。

計算エディタにseparate_addressという関数を入力し、括弧の中には引数として列名を指定します。

実行すると、住所を分割してリスト型のデータとして列を作成することができます。

リスト型のデータを列で分割したいため、列ヘッダメニューからリストの項目を列に分割を選択します。

リストの項目を列に分割のダイアログが表示されるので、そのまま実行します。

リスト型のデータを列で分割し、都道府県と市区町村、町名番地の列を作ることができました。

自分で試してみる

まだExploratoryをお持ちでない方は、この機会にぜひ試してみて下さい!

こちらのページよりサインアップ(無料)した後、Exploratoryをダウンロードし始めることができます!

サインアップする


データサイエンスを学ぶ

データサイエンスやデータ分析の手法を1から体系的に学び、現場で使えるレベルのスキルを身につけていただくためのトレーニングを定期的に開催しています。

データを使ってビジネスの問題を解決していくための、質問や仮説の構築の仕方などを含めたデータリテラシーも基礎から身につけていただくものとなっております。

ぜひこの機会に参加をご検討ください!

詳細を見る