Exploratory アワー #593 - 列に入っている複数の値を行に分割して別のデータフレームと結合したい

購入履歴データにおいて、1つのセルに複数の商品IDがカンマ区切りで格納されているケースがあります。このような場合、商品マスターとの結合を行うためには、まず商品IDを個別の行に分割する必要があります。

今回は、行分割機能を使用して複数の商品IDを個別の行に分割し、その後で商品マスターと結合する手順について説明します。

問題

解決方法

今回使用するデータは、購入履歴データと商品マスターの2種類です。購入履歴データは1行が1取引を表し、「購入商品」列には商品IDがカンマ区切りで複数格納されています。

商品マスターには、各商品IDに対応する商品カテゴリー、単価、フラグなどの情報が含まれています。このデータは1行が1商品IDという形式で構成されています。

購入商品列の行分割

購入履歴データの「購入商品」列に対して行分割を実行します。まず、「購入商品」列のヘッダーメニューから「分割」の「行に分割」、区切り文字として「カンマ」を選択します。

分割のダイアログが表示されたら、設定を確認して実行します。

この操作により、カンマ区切りで格納されていた商品IDが、それぞれ個別の行として分割されます。

商品マスターとの結合

行分割が完了したら、次は商品マスターとの結合を行います。「購入商品」列のヘッダーメニューから「結合」を選択します。

結合の設定では、以下の項目を指定します。結合先のデータフレームとして「商品マスター」を選択し、結合キーとして購入履歴データ側は「購入商品」列、商品マスター側は「商品ID」列を指定します。

これにより、各商品IDに対応する商品カテゴリーや単価などの情報が、購入履歴データに追加されます。この方法を使用することで、複数商品IDを含むデータを適切に処理し、必要な情報を結合することができます。

ビデオ

参考情報

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio