Google Data Studio(Data Portal) からDatabricks データに連携してレポートを作成

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData Connect



CData Connect Cloud を使ってDatabricks の仮想MySQL データベースを作成して、Google Data Studio(Data Portal)でDatabricks データを使ったカスタムレポートを作成します。

Google Data Studio は、大変使いやすいビジュアライゼーションとレポーティングが可能なサービスです。Google Data Studio とCData Connect Cloud を一緒に使うことで、簡単にDatabricks データに連携するレポートを作成することができます。この記事では、Google Data Studio とConnect Cloud でDatabricks に連携するシンプルなレポートを作成する方法を説明します。

CData Connect Cloud は、Databricks データのクラウドto クラウドのインターフェースを提供し、Google Data Studio からリアルタイムDatabricks データに連携することができます。ビジュアライズを作成すると、Google Data Studio がクエリを自動的に発行してリアルタイムデータを取得します。CData Connect Cloud がクエリ(フィルタリングやJOIN も可能)をパースしてDatabricks に送り、Google Data Studio にDatabricks からのデータを返します。インテリジェントなサーバーサイドプロセスで、多様なクエリをパフォーマンス良く利用できます。

この設定には、CData Connect Cloud インスタンスおよびCData Connect Cloud Connector for Google Data Studioが必要です。是非、https://www.cdata.com/jp/connect からCData Connect Cloud のトライアルと詳細情報をご覧ください。


CData Connect Cloud からDatabricks に接続

CData Connect Cloud は、直観的なPoint-and-click インターフェースでデータソースへの接続およびAPI エンドポイント作成を行います。

  1. Connect Cloud にログインして、Databases をクリックします。
  2. 利用できるデータソースアイコンから"Databricks" を選択します。
  3. Databricks に接続するために必要なプロパティを入力します。

    To connect to a Databricks cluster, set the properties as described below.

    Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

    • Server: Set to the Server Hostname of your Databricks cluster.
    • HTTPPath: Set to the HTTP Path of your Databricks cluster.
    • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).
  4. Test Database をクリックします。
  5. Privileges -> Add をクリックして、新しいユーザーを追加し、適切な権限を指定します。

これで、Databricks の仮想データベースが作成でき、Google Data Studio からの連携が可能になりました。

Google Data Studio からリアルタイムDatabricks データにアクセスしてビジュアライズを作成

以下の手順で、Google Data Studio でCData Connect Cloud を使って、Databricks データのビジュアライゼーションを作成します。

  1. Google Data Studio にログインして、データソース、新しいデータソースとクリックし、CData Connect Cloud Connector を選択します。
  2. Connector に権限を許可します。
  3. (myinstancemyinstance.cdatacloud.net)、username、password を入力してCData Connect にアクセスします。
    • Username: myinstance/username
    • Password: your Connect Cloud password
  4. Database (e.g. Databricks1) を選択して、Next をクリックします。
  5. Table (e.g. Customers) を選択します。
  6. Connect をクリックします。
  7. 必要があれば、カラムを変更できます。Create Report をクリックして、データを取得します。
  8. あとは通常のRDB などのデータと同じようにスタイルを選択してビジュアライズを作成します。
  9. Dimensions およびMeasures を選択していきます。

Optional:MySQL Connector への接続

もしカスタムSQL クエリを使いたい場合には、MySQL Connector を使うことで実現が可能です。Server アドレス、ポート、ユーザー名、パスワードのサーバー情報を使ってCData Connect Cloud に接続します。

クラウドアプリケーションからDatabricks データにSQL アクセスを実現

このようにGoogle Data Studio からDatabricks データにクラウドto クラウドでの連携ができました。CData Connect では、他にも多くのデータソースに対応しています。

クラウドアプリケーションから240+ SaaS、BigData、NoSQL にSQL でデータ連携するには、CData Connect Cloud を是非お試しください。