Tableau からDatabricks にJDBC Driver で連携してビジュアライズ

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks JDBC Driver

Databricks 連携のパワフルなJava アプリケーションを素早く作成して配布。



Tableau からリアルタイムDatabricks データに連携してビジュアライズ。

CData Drivers for Databricks を使って、BI・ビジュアライズツールのTableau からDatabricks データをノーコードで連携して利用できます。この記事では、CData JDBC Driver for Databricks を使います。Tableau はJDBC だけでなく、ODBC を使った連携(ODBC での記事はこちら)も可能です。JDBC は、Windows 版のTabelau でもMac 版のTableau でも同じように使えるのが特徴です。

※製品について詳しい情報をご希望の方は以下からお進みください。

Tabelau からDatabricks データへの接続を確立

Tableau での操作の前に.jar ファイルを以下のパスに格納します:

  • Windows: C:\Program Files\Tableau\Drivers
  • MacOS: ~/Library/Tableau/Drivers

.jar ファイルを配置したら、Databricks への接続をせていします。

  1. Tableau を開きます。
  2. [データ]->[新しいデータソース]を開きます。
  3. [その他のデータベース(JDBC)]をクリックします。
  4. URL にJDBC 接続文字列を入力します。
  5. To connect to a Databricks cluster, set the properties as described below.

    Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

    • Server: Set to the Server Hostname of your Databricks cluster.
    • HTTPPath: Set to the HTTP Path of your Databricks cluster.
    • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

    JDBC Driver の接続文字列デザイナーを使う

    JDBC 接続文字列を作るには、Databricks JDBC Driver のビルトイン接続文字列デザイナーを使う方法があります。ドライバーの.jar ファイルをダブルクリックするか、コマンドラインから.jar ファイルを実行します。

    Windows:

    java -jar 'C:\Program Files\CData\CData JDBC Driver for Databricks 2019\lib\cdata.jdbc.databricks.jar'

    MacOS:

    java -jar cdata.jdbc.databricks.jar

    接続プロパティに値を入力して、生成される接続文字列をクリップボードにコピーします。

    JDBC URLを設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

    デザイナーで生成されるJDBC URL のサンプル:

    jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
  6. 方言:SQL92
  7. サインインをクリックします。
  8. 接続エラーの場合には、Java がダウンロードされていない場合、Java が64bit マシン用ではなく32bit 用である、などの場合がありますので確認をお願いします。

スキーマ検出とデータのクエリ

  1. [データベース]のドロップダウンで、CData を選択します。
  2. [スキーマ]で、[CData]を選択します。
  3. テーブルをJOIN エリアにドラッグします。複数のテーブルを選択することも可能です。
  4. [今すぐ更新]か[自動更新]を選択します。[今すぐ更新]では、はじめの1000行のデータをプレビューで取得します(もしくは表示行を指定するボックスに取得する行数を指定可能 )。[自動更新]では、自動的にデータを取得してプレビューに表示します。
  5. [接続]メニューでは、[ライブ]もしくは[抽出]を選択します。常にリアルタイムデータを扱いたい場合には、[ライブ]を選択します。
  6. ワークシートのタブを開きます。CData Driver は、カラム情報やデータ型情報を自動的に検出するので、取得したDatabricks データのカラムはディメンションとメジャーに分けてリスト表示されます。
  7. デイメンションやメジャーを列・行のフィールドにドロップして、ビジュアライズを作成します。

CData JDBC Driver for Databricks をTabelau で使うことで、ノーコードでDatabricks データをビジュアライズできました。ぜひ、30日の無償評価版 をお試しください。