Databricks データをTableau Desktop でビジュアライズ

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks Tableau Connector

素早く手軽に、Tableau からDatabricks データに接続。包括的な高機能データアクセス、リアルタイム連携、メタデータ自動検出、SQL-92 の堅牢なサポートを提供します。



CData Tableau Connector for Databricks を使ってDatabricks データをTableau Desktop でビジュアライズ。

Tableau は、企業のデータ活用による問題解決の方法を変革させるビジュアルアナリティクスプラットフォームです。Tableau にCData Tableau Connector for Databricks を組み合わせて使うことで、Tableau からシームレスにDatabricks データを連携利用することができるようになります。この記事では、Tableau Desktop でDatabricks データに接続してシンプルなチャートを作る方法を説明します。

CData Tableau Connectors は、Tableau でリアルタイムDatabricks データへのハイスピードなデータアクセスを可能にします。 Connector をインストールして、Databricks への認証を行うだけで、すぐにレスポンシブで動的なビジュアライズやダッシュボードを作成しはじめられます。 Tabelau では、Databricks データがネイティブデータタイプでアクセス可能になり、複雑なフィルタリング、集計、他の処理を自動的に行います。

NOTE: CData Tableau Connectors の日本語版は、Tableau 2020.4 以降のバージョンで使用可能です。それより前のTableau バージョンではCData ODBC Driver for Databricks もしくは、CData JDBC Driver for Databricks を使ってDatabricks に接続することができます。2020.4 より前のTableau Online からDatabricks に接続するには、CData Connect を使って連携できます。

Tableau Desktop でDatabricks データを連携利用する

Tableau を開き「接続」 -> 「サーバーへ」-> 「その他」とクリックし、「CData によるDatabricks」をクリックします。
接続画面が開くので、接続プロパティを設定して「サインイン」をクリックして接続を確立します。

To connect to a Databricks cluster, set the properties as described below.

Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

  • Server: Set to the Server Hostname of your Databricks cluster.
  • HTTPPath: Set to the HTTP Path of your Databricks cluster.
  • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

Connection String での設定の場合には、スタートメニューのConnection Builder をクリック、もしくはインストールディレクトリのlib フォルダの.jar ファイルをダブルクリックしてConnection Builder を開き、プロパティを設定をすることでConnection String を取得することができます。「接続テスト」をクリックして、接続を確認します。Builder の「接続文字列」に表示された文字列をコピーしてTableau の接続画面のConnection String に貼り付けて「サインイン」をクリックして接続します。

スキーマの検出から使用データのDiscover Schemas and Query Data

  1. 「Database」のプルダウンメニューが表示された場合にはCData もしくは表示されたデータベース名で使用するものを選択します。
  2. 「Schema」のプルダウンメニューが表示された場合にはDatabricks もしくは表示されたスキーマ名を選択します。
  3. 左ペインの「Table」にDatabricks で使用可能なテーブルが表示されます。ビジュアライズで使うテーブルをデータセット作成エリアにドラッグ&ドロップします。複数のテーブルを選択してドロップすることが可能です。複数のテーブルを選択して、リレーションを設定することが可能です。
  4. 右上の接続モード選択で、「ライブ」もしくは「抽出」を選択します。
  5. 「今すぐ更新」もしくは「自動更新」 をクリックします。「今すぐ更新」では、はじめの10,000行を取得します。取得する行数は個別に行ボックスで設定可能です。「自動更新」ではプレビューエリアのデータが自動的に更新されます。
  6. 「ワークシート」タブをクリックします。選択したデータのカラムがデータ型によりディメンションかメジャーとしてリスト表示されています。CData Tableau Connector は、自動的にデータ型を検出してくれるので、このようにすぐにデータをビジュアライズで使うことができます。
  7. 「ディメンション」 もしくは 「メジャー」「列」 もしくは 「行」 にドラッグ&ドロップします。
  8. 「表示形式」 タブから、お好みのグラフタイプを選択します。Tableau がデータを選択したグラフタイプで表示します。

このように、CData Tableau Connector for Databricks を使うことで、Tableau で簡単にDatabricks データを扱うことができます。是非、30日の無償トライアル を使って、パワフルかつシンプルなデータ連携を体感してください。