今回はExploratoryでzipanguを使って住所を分割する方法を紹介します。
日本の住所は都道府県や市区町村で分けるのが難しく、例えば北海道にある"北海道余市郡余市町朝日町"という地域は「市」や「町」が複数あるため簡単に分けることができません。
そこで、この問題を簡単に解決してくれるのがUryuさんが開発したzipanguというRパッケージです。
それでは、Exploratoryでzipanguを使って住所を分割していきましょう!
プロジェクトレベルのメニューから、「R パッケージの管理」を選ぶと、パッケージをインストールすることができるダイアログがでてきます。
「パッケージをインストール」のタブを選んで、「zipangu」とタイプして、「インストール」ボタンを押します。
インストールが終わると、「zipangu」が「インストール済みのパッケージ」のリストに入っており、さらにチェックされてます。ここでチェックされていると、そのパッケージの関数をそのまま使うことができるということです。
今回はAirbnbの東京の宿泊施設データを使用します。
"東京都西東京市南町1丁目12"といった住所があった時に、これを"東京都", "西東京市", "南町1丁目12"のように分けたいとします。
住所の列ヘッダメニューから計算を作成をクリックします。
計算を作成のダイアログが表示されます。
計算エディタにseparate_address
という関数を入力し、括弧の中には引数として列名を指定します。
実行すると、住所を分割してリスト型のデータとして列を作成することができます。
リスト型のデータを列で分割したいため、列ヘッダメニューからリストの項目を列に分割を選択します。
リストの項目を列に分割のダイアログが表示されるので、そのまま実行します。
リスト型のデータを列で分割し、都道府県と市区町村、町名番地の列を作ることができました。
まだExploratoryをお持ちでない方は、この機会にぜひ試してみて下さい!
こちらのページよりサインアップ(無料)した後、Exploratoryをダウンロードし始めることができます!
データサイエンスやデータ分析の手法を1から体系的に学び、現場で使えるレベルのスキルを身につけていただくためのトレーニングを定期的に開催しています。
データを使ってビジネスの問題を解決していくための、質問や仮説の構築の仕方などを含めたデータリテラシーも基礎から身につけていただくものとなっております。
ぜひこの機会に参加をご検討ください!