列数や行数の多いCSVデータで有効な列を効率的に確認する方法

特に列数の多いデータをインポートするときに顕著ですが、列数や行数の多いCSVファイルをそのままインポートすると時間がかかる場合があります。

そのようなときには、全データを読み込む前に先頭から指定した分の行だけ読み込んで、サマリビューを確認することが有効です。インポートしたデータフレームのサマリビューを確認することで、以下のようなデータを特定できます。

上記に該当する列を特定できたら、後は全行のデータをインポートするときに、不要な列をあらかじめ取り除いた状態で、データをインポートすることが可能です。

ここからは先頭から指定した行数分のデータをインポートする方法を紹介いたします。

まず、 データフレームの横にあるプラスボタンをクリックして Rスクリプトを選択します。

R スクリプトを選択したら、CSV ファイルを読み込む read_csv関数を使い、n_maxという読み込む行数を指定する引数を指定することが可能です。

read_csv(
  "/Users/im/Downloads/Temp/従業員.csv", #ファイルのパスを指定
  locale = locale(encoding = "utf-8"), #文字エンコーディングを指定。多くの場合、"UTF-8"か"CP932"のいずれかが利用されます
  n_max = 100 # 先頭100行だけ読み込む
)

保存ボタンをクリックすると、指定した行数だけデータがインポートされるので、絞り込んだデータでサマリビューを確認してください。

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio