データサイエンスやデータ分析と言うと、難しいアルゴリズムなどを使って驚くようなインサイトを導き出すというイメージがあるかもしれません。
しかし、実はデータサイエンスの80%ほどの時間は「データラングリング」というデータの整形や加工作業に費やされています。
一部では「前処理」と言われたりもしますが、例え「前処理」が終わったきれいなデータであっても、データを分析する際に次から次へと出てくる様々な質問に答えるためには、データの形を柔軟に変え、様々な計算処理を行っていく必要があります。
そこで、データラングリングに関する様々なExploratoryの機能を体験していただけるコンテンツを用意しております。
それぞれのテーマごとに4つの「使い方」のノートがありますが、実際にサンプルデータを使って手を動かしながら学んでいただくようにデザインされており、各パートは20分ほどで実施できるようになっています。
是非、こちらのページをブックマークに追加いただき、Exploratoryをお試しください!
Exploratoryをまだインストーされていない方は、まずは以下のインストールガイドを参考にインストールしてみてください。
うまくインストールができない場合は、support@exploratory.io の方にメールをいただくか、ウェブサイト上のチャットのウィンドウごしに、お気軽にご連絡ください。
こちらのノートは、Exploratoryでデータをラングリング(加工・整形)する際に、抑えておきたい一般的なデータの加工に関する便利な機能を体験いただけるようにデザインしております。
データにはデータが増えるほど横に広がる「ワイド」型のデータと、縦に伸びる「ロング」型という2つの持ち方があり、各々の持ち方に得意なことがあります。
このパートでは、ワイド型とロング型のデータを自由自在に変換する方法を体験していただけるようになっています。
テキストデータを扱っていく際によくある問題として、表記揺れがあったり、不要な文字や記号などが含まれていて文字列が綺麗に整えられていない、またはある文字列を置換、抽出したいといったことがよくあります。
こちらのノートでは、テキストデータを加工して文字列を綺麗に整えたり、文字列に対して置換や抽出する際の便利な機能を体験していただけるようになっています。
Exploratoryでデータラングリングをしていく際に、データの加工の記録がされる「ステップ」機能によって、同じ処理を別のデータフレームに対して実行したり、新しいデータに対して再実行することができます。
このノートでは、「ステップのコピー」や「ブランチ」、「データの再現性」など、データラングリングする際に便利な機能を体験していただけるようになっています。
専門スタッフによる無料のオンライン相談の機会も設定させていただいています。
上記のようなご相談だけでなく、データ活用に関するその他の質問にも回答させていただきます。ご興味がある方は、ツアーを始める前や途中でも構いませんので、気軽にご連絡ください。