Exploratoryのノートは強化版レポーティングツールです。

マークダウンのフォーマットで、発見したインサイトについて書いたり、Exploratory デスクトップで作成したチャートやアナリティクスをノートに埋め込むことができます。

これだけではありません。

ExploratoryのノートはRの世界で最も人気のあるレポートツールであるRMarkdownの拡張版です。つまり、ノートの一部としてRコードを埋め込んで、お気に入りのRパッケージでデータを可視化したり、文章の一部として動的な計算を埋め込んだりすることもできます。

Markdownの書式についてはこちらを参照してください。

ノートで何ができるのか?

以下がExploratoryのノートで出来ることの一覧です。

  1. ノート・エディタを別ウィンドウで開く
  2. テキストをマークダウンで書く
  3. 結果をプレビューする
  4. 可視化チャートを埋め込む
  5. アナリティクスチャートを埋め込む
  6. チャートサイズを設定する
  7. Rのコードブロックを埋め込む
  8. 行の中にRのコードを埋め込む
  9. HTML/ワード/PDFとして保存する
  10. パブリッシュしてシェアする
  11. 古いバージョンのノートに復元する

では一つずつ見ていきましょう

0. ノート・エディタを別ウィンドウで開く

ノートを書くときに、しばしばExploratoryデスクトップで作成していたチャートとアナリティクスを含めたい時があります。また、設定を変更するためにチャートを開く必要があることもあります。

そんな時にノートとチャート(もしくはアナリティクス)の間を行ったり来たりするのは面倒です。

そこで、ノートエディタを別ウィンドウで開けば作業効率が向上します。

こうすることで、ノートエディタを開いたまま、関連するチャートやアナリティクスを更新することができます。

1. テキストをマークダウンで書く

マークダウンとは?

以下のようなものを見たことがありますか?

マークダウンのテキストはこのようになります。テキストの書式を設定するために特別なテキスト(たとえば、H1ヘッダーには#、H2ヘッダーには##など)を使用します。

なぜマークダウンを使うのか?

Exploratoryのマークダウン・エディタは、マークダウンの書式に基づいてテキストを即時に更新するSimpleMDEというマークダウン・エディタの上に構築されています。

下記の標準的なマークダウンの書式設定の構文がサポートされています。

  • ヘッダ
  • ボールド / イタリック
  • リスト
  • URL リンク
  • イメージ
  • 引用
  • テーブル

以下が例となります。

ツールバーのフォーマットオプション

マークダウンに馴染みがないですか?

ご安心ください、ツールバーのアイコンを使ってフォーマットをすることができます。

キーボードショートカット

アイコンクリック派というより、キーボードショートカット派ですか?

いいニュースがあります。ほとんどのフォーマットをキーボードショートカットで行うことができます。キーボードアイコンをクリックするとサポートされているキーボードショートカットの一覧を確認できます。

2. 出力を確認する

ノートの結果を確認する方法が2つあります。画面分割モードとシングル・ビュー・モードです。

画面分割モード

これがデフォルトのモードです。左側の画面で編集し、右側の画面で出力を確認します。

編集した結果を確認するには右側の画面の緑のリフレッシュボタンをクリックするか、編集した左側の画面で“コマンド(WindowsではCtr)+R”キーを押します。

シングル・ビュー・モード

画面分割モードからシングル・ビュー・モードへ切り替えるには、画面左上の“シングル・ビュー・モードへの切り替え”ボタンをクリックします。すると、以下のように画面全部が編集モード(もしくは実行モード)である、シングル・ビュー・モードに切り替わります。

編集画面で行った変更結果を確認するには実行ボタンをクリックします。

3. 可視化チャートを埋め込む

同じプロジェクトの中で作成した可視化チャートをノートに埋め込むことができます。ツールバーでチャートのアイコンをクリックします。

ノートに埋め込みたいチャートを選択します。

選択すると、以下のように’exploratory’という属性のついたコードブロックが挿入されます。

画面分割モードの場合、‘リフレッシュ’ボタンをクリックするかコマンド(WindowsではCtr)+R“キーを押してレポートを生成します。

シングル・ビュー・モードの場合は、実行ボタンをクリックしてレポートを生成します。

全てのチャートのデータはどうやって生成されるのか?

ノートに埋め込まれたチャートを生成する際に、Exploratory デスクトップはチャートの元となるデータが生成済みかどうかをチェックします。もしまだデータが生成されていない場合、チャートに紐づくデータラングリングのステップを自動的に実行し、チャートデータを生成します。

例えば、プロジェクトを開いて、データフレームやチャートには手を触れず、真っ先にノートを開いたとしましょう。この時点ではノートに埋め込まれたチャートに必要なデータはまだ処理されていません。この場合、このノートで必要な全てのデータラングリングのステップを、Exploratory デスクトップはノート生成の一環として自動的に実行し、ノートに埋め込まれたチャートに必要なデータを準備します。 こんな簡単に動くんです! 💪

4. アナリティクス・チャートを埋め込む

アナリティクス・チャートをノートに埋め込むこともできます!

ノートで、ツールバーの“アナリティクス”アイコンをクリックします。

ダイアログで、埋め込みたいアナリティクスを選ぶことができます。

ダイアログで選択すると、次のようなコードが挿入されます。

“リフレッシュ”ボタンをクリックすると、可視化チャートの場合と同じく、アナリティクス・チャートが動的に生成されます。

5. チャートのサイズを大きくする

デフォルトでは、チャートはノートのテキストエリアの横幅に合わせたサイズで生成されます。

しかしながら、いくつかのチャートに関してはさらに横幅を広く使って表示させたいかもしれません。

’exploratory’タグの中の“width”という属性に“full”と指定することで、これを実現できます。

これによってチャートは文書の全部の幅を使って表示されます。

ピボット、テーブル、スモール・マルチプルをスクロールバーなしで表示する

デフォルトでは、これらの可視化チャートは、データ量が多くてデフォルトの高さで収まらない場合、右側にスクロールバーを表示します。

しかしながら、場合によってはピボットテーブルのデータを全行表示したいかもしれません。この場合、以下のように“height”属性に“full”を指定することで実現できます。

これによって、ピボットテーブル全行表示できます。

6. Rコードを埋め込む

もし、R Markdownを使ったことがあったり、Rコードを書くのに抵抗がない場合、ExploratoryデスクトップはR Markdownと連携しているので、Rコードを書いてその結果をノートに埋め込むことができます。

Rのコードを埋め込みには二通りの方法があります。

  • 引用ブロック
  • インラインテキスト

R コード —  引用ブロック

ツールバーの丸く囲われたRボタンをクリックします。すると、以下のようなRコードが入力されます。

コードブロックの中に、自由にRのコードを書くことができます。例えば、以下は ggplot2 パッケージを使って、density plotを書く例です。

これによって、“リフレッシュ”ボタンをクリックすると、以下のような出力が得られます。

デフォルトではこのチャートを書くのに必要なRのコードはノートに表示されていません。表示する場合は、Rコードの“r”セクションで、“echo”というパラメタをTRUEに変えます。

リフレッシュボタンを押して、チャートを再度描画すると、以下のように’コード’ボタンがあるのが分かります。

コードボタンをクリックすると、チャートを生成するのに使われたRコードを表示することができます。

“コードの折りたたみ”の設定をダイアログで“オフ”に変えることができます。

そうすると、コードは常に表示されるようになります。

7. インラインのRコード

R Markdown連携のもう一つの素晴らしい点は、“インライン”のRコードを埋め込むことが出来る点です。これによって文書の中の一部をRに動的に生成させることができます。

ここでは、今日に日付を’lubridate’パッケージの’today()’関数を使って最初のセクションで動的に生成しています。次の文では、Rのベースの’nrow()’関数を使って、このレポートで参照しているデータフレームの行数をRで計算しています。

“リフレッシュ”ボタンをクリックすると、矢印の部分が動的に生成されたのが分かります。

この他にもRMarkdownとRを使って様々なことを実現できますが、それはまた別の機会にご紹介します。

8. 文章をHTMLやワードやEDFでエクスポート

作成したノートをHTMLやワードの文章として保存できます。これによって、ノートをemalで送ったり、webサイトやドキュメントサーバーにホストすることが可能になります。

HTMLにエクスポート

HTMLにエクスポートでは、ノートに必要なすべてのものを含むzipファイルが生成されます。zipファイルには HTMLファイルと共に、チャートを表示するのに必要なJavaScriptも含まれているので、チャートはインタラクティブになり、ズームイン/アウトなどのいくつかのアクションをサポートします。

ワード文章にエクスポート

‘ワード文章にエクスポート’を選択すると、ワード(docx)のフォーマットでレポートを生成できます。

全てのチャートはワード文章の中にイメージとして生成されます。

EDF — Exploratory データ・フォーマット

ノートを再現可能な形でシェアしたいですか?

そんな場合は、EDF,(Exploratory Data Foramtの略称)を使います。EDFはノートを再現するのに必要な全てのデータ、データラングリングのステップ、チャートなどを内包しています。

ノートをEDF としてエクスポートしたら、Exploratory デスクトップを使っている同僚やチームメンバーに渡して共有できます。または、自分が持っているExploratory デスクトップの別のプロジェクトにインポートしたり、違うマシンへの移行手段としても使えます。

別のプロジェクトへのインポートは、そのプロジェクトで レポート の横にある+(プラス)ボタンをクリックして、EDFをインポートを選ぶことで、インポートできます。

このEDFはデータ・フレームのメニューの下にあるファイルデータ(EDF)としては読み込まないでください。必ず レポート の下にある、EDFをインポートを選んでください。

インポートが完了すると、ノートだけでなく、そのノートが参照する全てのデータフレームもインポートされているのが分かります。

これによって、データラングリングのステップも含めた形で完全に再現可能なノートを作ることができます。

ノートをチームメンバーにEDFとして共有すれば、メンバーは、あなたがどうやってそのノートのためのデータを準備したのかも知ることができるのです。これが再現性の力なんです!

9. ノートをパブリッシュして共有する

Exploratoryのクラウドサーバー(exploratory.io)にパブリッシュして、作成したノートを他のメンバーと共有できます。パブリッシュボタンをクリックして、簡単に共有できます。

共有はパブリック(誰でも見れる)かプライベート(特定のメンバーと共有)かを選べます。

プライベートで共有した場合は、誰がアクセスできるかemailアドレスを設定することで管理できます。または、各ノートに一意のURL を生成し、そのURLを共有したい人に渡してアクセスを管理することもできます.

EDFを共有

ノートを再現可能な形で共有したいですか?

そんな場合は、EDF,(Exploratory Data Foramtの略称)を使います。EDFはノートを再現するのに必要な全てのデータ、データラングリングのステップ、チャートなどを内包しています。

EDFダウンロードオプションをチェックすることで、ノートと、そこに含まれるチャート、そしてチャートの描画に必要となるする全ての関連するデータフレームが一緒にパッケージされます。

共有された人は、ダウンロードボタンをクリックしてEDFをダウンロードできます。

すると、その人はExploratoryデスクトップにEDFをインポートしてノートを再現できます!

10. 古いバージョンに戻す

あれ? ノートの中身を間違って消してしまいましたか?

Exploratoryが思ったように動かなくて、ノートの中身が消えちゃいましたか? (もし、そんなことがあったらすぐに連絡してください!)

例えコンテンツを失ったわけではなくても、変更前の状態に戻したいということはしばしばあります。

変更履歴ダイアログを使えば元に戻せます!

変更履歴のダイアログで、もとに戻したいバージョンを選び、“このステートに戻す”ボタンをクリックします。

これで、ノートをそのバージョンに戻します。

もし、古いバージョンに戻す前の状態に戻したいときは、変更履歴のダイアログを開き、単純に前のバージョンを選ぶことができます。


どんなデータ分析プロジェクトでも、チームの他のメンバーにインサイトを伝えるのは鍵となる成功要因です。ノートを使えば、簡単にプロダクションレベルのレポートを作れるだけではなく、多くのRパッケージを活用して、ストーリーをさらに強力かつ効果的にすることができます。


まだExploratory Desktopをお持ちでない場合は、こちら から30日間無料でお試しいただけます。


データサイエンスを本格的に学んでみたいという方へ

2019年1月に、Exploratory社がシリコンバレーで行っている研修プログラムを日本向けにした、データサイエンス・ブートキャンプが東京で行われます。本格的に上記のようなデータサイエンスの手法を、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に、参加を検討してみてはいかがでしょうか。こちらに詳しい情報がありますのでぜひご覧ください。