製品をチェック

無償トライアル:

無償トライアルへ

製品の情報と無償トライアルへ:

Databricks ODBC Driver

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデータベースのように標準ODBC インターフェースで読み書き。

データ連携でお困りですか?

お問い合わせ

Databricks のデータをTableau Desktop で可視化・ダッシュボードを構築する


CData ODBC Driver for Databricks は、Tableau へのDatabricks 連携をノーコードで手軽に実現します。


加藤龍彦
ウェブデベロッパー

databricks ロゴ画像

ODBC Driver

odbc ロゴ画像
Tableau Desktop ロゴ画像


こんにちは!ウェブ担当の加藤です。Tableau といえば、直感的に使えるUI と高度なデータ分析・ダッシュボード構築機能を備えた人気のBI ツールですね。このTableau をCData ODBC Driver for Databricks と組み合わせることで、Tableau からリアルタイムでDatabricks データにアクセスできます。本記事では、CData ODBC Driver のインストールからTableau Desktop でのDatabricks データへの連携、ダッシュボードの構築までをステップバイステップでご紹介します。

Databricks のODBC 接続を構成する

まずは、Databricks への接続に必要な下準備を行います。CData ODBC Driver for Databricks のインストールがお済みでない方は、記事右側部分から「無償トライアルへ」ボタンをクリックし、製品をインストールしてください。インストール後自動で開かれるMicrosoft ODBC データソースアドミニストレーターを使って、ODBC DSN を作成および設定できます。

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。

Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

  • Database:Databricks データベース名に設定。
  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • Token:個人用アクセストークンに設定(この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます)。

Tableau Desktop にODBC 接続を追加する

次に、Tableau Dekstop を開いて先ほど設定したDatabricks へのODBC 接続を、データソースとして追加しましょう。まずは、Tableau Desktop を起動します。

  1. 起動後最初に表示される画面で、「接続」パネルから、「その他」→「その他データベース(ODBC)」をクリックします。
  2. 接続パネルからODBC 接続画面を表示
  3. 表示される画面の「DSN」に、先ほど設定したCData Databricks Source を指定して、「接続」をクリックします。完了したら、「サインイン」ボタンをクリックします。
  4. ODBC 接続画面

Databricks データへの接続はこれだけで完了です!ここからは実際にDatabricks データを取得して、データを使ったダッシュボードを作っていきましょう。

Tableau でDatabricks データを可視化する

可視化・分析に使用するDatabricks データを選択する

まずはDatabricks から可視化 / 分析に使うデータを指定します。

  1. 「データ ソース」の画面が表示されたら、「データベース」ドロップダウンで「CData」を選択します。
  2. データベースドロップダウンでCData を選択
  3. 次に、「スキーマ」ボックスで「🔎」(検索)マークをクリックして、「Databricks」を選択します。
  4. スキーマボックスでDatabricks を選択
  5. 次に「テーブル」ボックスで、Databricks 内の可視化したいテーブル名を検索して選択します。または、「🔎」(検索)マークをクリックしてテーブルを一覧を表示してそこから選択したり、「新しいカスタム SQL」ボタンからSQL ベースでデータをクエリすることもできます。
  6. テーブルボックスでテーブルを選択
  7. テーブルを選択すると右側の画面に選択したテーブルが表示されるので、必要に応じてテーブル間の関連付けを行います。画面下部のペインで選択したテーブルのフィールドやプレビューを参照できます。
  8. テーブルを選択して関連付けを行う
  9. 右上の「接続」メニューで「ライブ」オプションをクリックすると、Tableau へのデータロードをスキップしてリアルタイムでデータを扱うことができます。

これで、可視化に使用するデータの準備が整いました。あとは、Tableau の強力な可視化機能をフル活用してデータを可視化 / 分析できます。

Databricks データを可視化する

それでは、実際にDatabricks のデータを可視化してみましょう。ここでは例としてCustomers テーブルのデータを使います。

  1. データソースからシートタブに移動して、「テーブル」以下に表示されているカラムから可視化したいカラムを選択して行と列にドラッグドロップします。Tableau が自動で適切なグラフを選択くれるので、これだけでデータを可視化できました。
  2. テーブルからカラムを選択してドラッグドロップ
  3. 複数のワークシートを作成すれば、組み合わせてダッシュボードを構築することもできます。
  4. シートを組み合わせてダッシュボードを構築

おわりに

このようにCData ODBC Driver を利用することで、各種クラウドサービスをTableau Desktop の接続先として利用できるようになります。CData ではDatabricks 以外にも270種類以上のデータソース向けにODBC Driver を提供しています。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。