Databricks にデータ連携するダッシュボードをTableau Server にパブリッシュする方法

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks Tableau Connector

素早く手軽に、Tableau からDatabricks データに接続。包括的な高機能データアクセス、リアルタイム連携、メタデータ自動検出、SQL-92 の堅牢なサポートを提供します。



CData Tableau Connector for Databricks をTableau Server から使用してDatabricks データをノーコードでビジュアライズで使う方法。

Tableau Server は、企業のデータ活用による問題解決の方法を変革させるビジュアルアナリティクスプラットフォームです。Tableau にCData Tableau Connector for Databricks を組み合わせて使うことで、Tableau Server からシームレスにDatabricks データを連携利用することができるようになります。この記事では、Tableau Server でDatabricks データに接続してシンプルなチャートを作る方法と、Tableau Desktop でDatabricks データソースをパブリッシュする方法の二つを説明します。

CData Tableau Connectors は、Tableau でリアルタイムDatabricks データへのハイスピードなデータアクセスを可能にします。 Connector をインストールして、Databricks への認証を行うだけで、すぐにレスポンシブで動的なビジュアライズやダッシュボードを作成しはじめられます。 Tabelau では、Databricks データがネイティブデータタイプでアクセス可能になり、複雑なフィルタリング、集計、他の処理を自動的に行います。

NOTE: CData Tableau Connectors の日本語版は、Tableau 2020.4 以降のバージョンで使用可能です。それより前のTableau バージョンではCData ODBC Driver for Databricks もしくは、CData JDBC Driver for Databricks を使ってDatabricks に接続することができます。2020.4 より前のTableau Online からDatabricks に接続するには、CData Connect を使って連携できます。

Tableau Server にDatabricks Connector をインストール

Tableau Server をホストしているマシンにCData Tableau Connector をインストールします。

  1. Tableau Desktopがインストールされていない環境の場合、インストール中に「This setup could not copy important connector files to ...」というダイアログが表示されます。サーバーマシン上で、cdata.databricks.tacocdata.tableau.databricks.lic ファイルを、インストールディレクトリ(C:\Program Files\CData\CData Tableau Connector for Databricks\lib\)からコピーします。
  2. コピーしたファイルをTableau Server Connectors のフォルダに貼り付けて「サインイン」をクリックして接続します。
    C:\ProgramData\Tableau\Tableau Server\data\tabsvc\vizqlserver\Connectors
  3. ファイルをコピーしたら、後のダイアログはOK ボタンをクリックしてインストールを完了します。
  4. Tableau Server を再起動します。

Tableau Server にブラウザからDatabricks データをビジュアライズ

Tableau Server にブラウザからアクセスして、ブラウザからDatabricks データに連携する設定を行い、Databricks のダッシュボードを作成することができます。

Tableau Server でのDatabricks データへの接続

  1. Tableau Server サイトにブラウザでアクセスします。
  2. 「Create」 -> 「Workbook」でワークブックを作成します。「Connect to Data」ダイアログでConnectors タブを開きます。コネクタ一覧内の「Databricks by CData」を選択します。
  3. 接続プロパティを設定して「SignIn」をクリックして接続を確立します。

To connect to a Databricks cluster, set the properties as described below.

Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

  • Server: Set to the Server Hostname of your Databricks cluster.
  • HTTPPath: Set to the HTTP Path of your Databricks cluster.
  • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

Connection String での設定の場合には、スタートメニューのConnection Builder をクリック、もしくはインストールディレクトリのlib フォルダの.jar ファイルをダブルクリックしてConnection Builder を開き、プロパティを設定をすることでConnection String を取得することができます。「接続テスト」をクリックして、接続を確認します。Builder の「接続文字列」に表示された文字列をコピーしてTableau の接続画面のConnection String に貼り付けて「SignIN」をクリックして接続します。

接続したDatabricks データのビジュアライズをブラウザから作成

  1. 「Database」のプルダウンメニューが表示された場合にはCData もしくは表示されたデータベース名で使用するものを選択します。
  2. 「Schema」のプルダウンメニューが表示された場合にはDatabricks もしくは表示されたスキーマ名を選択します。
  3. 左ペインの「Table」にDatabricks で使用可能なテーブルが表示されます。ビジュアライズで使うテーブルをデータセット作成エリアにドラッグ&ドロップします。複数のテーブルを選択してドロップすることが可能です。複数のテーブルを選択して、リレーションを設定することが可能です。
  4. 右上の接続モード選択で、「ライブ」もしくは「抽出」を選択します。
  5. 「今すぐ更新」もしくは「自動更新」 をクリックします。「今すぐ更新」では、はじめの10,000行を取得します。取得する行数は個別に行ボックスで設定可能です。「自動更新」ではプレビューエリアのデータが自動的に更新されます。
  6. 「ワークシート」タブをクリックします。選択したデータのカラムがデータ型によりディメンションかメジャーとしてリスト表示されています。CData Tableau Connector は、自動的にデータ型を検出してくれるので、このようにすぐにデータをビジュアライズで使うことができます。
  7. 「ディメンション」 もしくは 「メジャー」「列」 もしくは 「行」 にドラッグ&ドロップします。
  8. 「表示形式」 タブから、お好みのグラフタイプを選択します。Tableau がデータを選択したグラフタイプで表示します。

Tableau Desktop からDatabricks データソースをTableau Server にパブリッシュ

Tableau Desktop 側にも同じCData Tableau Connectors 製品をインストール済の場合は、Tableau Desktop で作成したデータソースをTableau Server にパブリッシュして利用することが可能です。Tableau Desktop への CData Tableau Connectors製品のインストール手順はこちら を参照してください。

まずは、Tableau Desktop でDatabricks Connector でDatabricks データをデータソースとして設定します。

  1. 「サーバー -> 「サインイン」をクリックします。
  2. Tableau Server のURL をセットして、接続ボタンをクリックするとサインインダイアログが表示されるのでTableau Serve rにサインインします。
  3. Tableau Desktop のメニューで「サーバー」->「データソースのパブリッシュ」-> からパブリッシュするデータソース名をクリックします。
  4. Tableau Server にデータソースをパブリッシュするダイアログが表示されます。プロジェクトを選択して「パブリッシュ」をクリックします。
  5. ブラウザが起動してTableau Server のパブリッシュしたデータソースが表示されます。Connections タブ内のDataSource 右下の「...」をクリックして「Edit Connection...」を開きます。
  6. パスワードをコネクションに埋め込むために、Password を「Embedded password in conneciton」に変更してパスワードをセット、Test Connection で接続を確認してSave します。
  7. これで、New > Workbook using this datasource から本データソースを利用したワークブックが作成できるようになります。
  8. ビジュアライズを作成します。

このように、CData Tableau Connector for Databricks を使うことで、Tableau Server で簡単にDatabricks データを扱うことができます。是非、30日の無償トライアル を使って、パワフルかつシンプルなデータ連携を体感してください。