Exploratory デスクトップからGoogle BigQueryのデータをインポートするには、Google Cloud Platform上で「プロジェクト」と「データセット」が作成されている必要があります。
もし、Google BigQuery上で「プロジェクト」と「データセット」を作成していない場合は、先にそちらを進めてください。
データフレームの横にある+(プラス)ボタンをクリックして、「データベースデータ」を選択します。
「Google BigQuery」を選択します。
アクセス権限の設定ダイアログが表示されるので、「権限の付与」を選択します。
ブラウザが起動し、アカウントの選択画面が表示されるので、Google BigQueryで使用するアカウントを選択します。
「Exploratory が Google アカウントへのアクセスをリクエストしています」というダイアログが表示されるので、「許可」をクリックします。
「権限の付与に成功しました!」画面が表示されたらアクセス権限の設定は完了です。
Exploratoryデスクトップに戻り「同期」ボタンをクリックします。
すると、Google BigQueryの設定ダイアログが表示されるので、「プロジェクト」を選択し、「ok」ボタンをクリックします。
なお、Google BigQueryの設定ダイアログでは以下の項目の設定もサポートしています。
SQLのクエリの中に含まれる列数が多い場合、クエリの結果が欠損値になることがあります。SQLのクエリの中に含まれる列数が多いときに、「ページ・サイズ」小さめの値を設定することで、この問題を回避できます。
また、クエリの結果に多くのリスト型の列が含まれている場合も、ページサイズを小さくしてクエリ結果を取り込むようにしてくだしさい。なお、ページサイズを小さくすると、データの取り込み処理が遅くなりますので、ご注意ください。ページサイズはインポートダイアログからも変更が可能です。
Google クラウドストレージ 経由でデータをインポートする場合は、選択したプロジェクトに属するバケットを選択して下さい。これによりデータダウンロードの速度が向上します。
古い非標準のSQL言語であるBigQuery SQLを使いたいときは「標準SQLを利用する」のチェックボックスを外してください。
なお、Google 標準SQLはSQL 2011標準に準拠し、ネストされ繰り返されたデータのクエリをサポートする拡張機能を備えています。標準 SQLには、レガシー SQLに勝る次のような利点があります。
これらの機能の一部を示す例については、Google 標準 SQL の要点をご覧ください。また、標準SQLへの移行についてはこちら参照してください。
SQLのクエリエディタでは、SQLをパラメーター化してクエリの内容をダイナミックにアップデートして、インポートするデータをダイナミックに変更することが可能です。
SQLでパラメータを使う方法の詳細はこちらをご覧ください
SQLのクエリを実行して、プレビュー画面から必要なデータを取得できていることを確認できたら、「直接インポート」を選択し、データをインポートすることができます。
このとき、Google BigQueryの設定から「バケット」を設定している場合、「Google クラウドストレージ経由でインポート」することも選択できます。
設定したBig Queryの設定は、プロジェクトメニューの「データコネクション」から変更が可能です。
データコネクションの一覧からGoogle BigQueryのコネクションの「編集」ボタンをクリックします。
すると、Google BigQueryの編集ダイアログが表示されるので、設定を変更することが可能です。
以下のリンクからよくあるGoogle Big Queryの問題と解決法の確認が可能です。Google BigQueryからのデータをインポートするときに問題があった方はこちらをご覧ください。