データラングリングを効率化するためのTips

こちらの内容は2021/06/11(金) に行われたExploratoryデータサイエンス勉強会#19のご発表内容となります。

スピーカー

ヒッドワークス合同会社 四方 秀和様

概要

データラングリングとは、データをきれいにしたり、分析できる形に整えたり、様々な質問に答えるためにデータの形を柔軟に変換したりするためのデータの加工に関する手法をまとめたものです。データサイエンスの80%の時間は「データラングリング」に費やされていると言われているくらい、データ分析において重要なタスクになります。

そこで、Exploratoryを使ってデータラングリングの作業時間を減らすために、自動化や効率化するためのTipsとして、4つの領域での事例をご紹介いただきました。

アジェンダ

  • 自己紹介と会社紹介
  • 勤怠のダッシュボードの自動化
  • 大量データのvlookupが効率化
  • 複数ファイルの一括インポート&マージ
  • 気軽にデータ分析(汚いデータから可視化)
  • まとめ

ビデオ

スライド

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio