Aqua Data Studio からDatabricks のデータに連携
Databricks のデータにAqua Data Studio のVisual Query Builder やTable Data Editor からデータ連携。
加藤龍彦
デジタルマーケティング
最終更新日:2022-08-10
CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
CData JDBC Driver for Databricks は、Aqua Data Studio のようなIDE のウィザード・アナリティクスにDatabricks のデータを統合します。本記事では、Databricks のデータをコネクションマネージャーに接続してクエリを実行する手順を説明します。
JDBC Data Source の設定
コネクションマネージャーで、新しいJDBC データソースとして、接続プロパティ設定を行い、保存します。Databricks のデータがAqua Data Studio ツールから使えるようになります。
- Aqua Data Studio で、Server メニューから Register Server を選択します。
- Register Server フォームで、 'Generic - JDBC' コネクションを選びます。
- 次のJDBC 接続プロパティを設定します:
- Name:任意の名前、データソースの名前など。
- Driver Location:Browse ボタンをクリックして、インストールディレクトリのlib フォルダの cdata.jdbc.databricks.jar ファイルを選択します。
- Driver:クラス名に cdata.jdbc.databricks.DatabricksDriver を入力。
- URL:jdbc:databricks: から始まるJDBC URL を入力します。接続プロパティをカンマ区切りで書きます。接続プロパティの詳細は、ヘルプドキュメントを参照してください。一般的な接続文字列は:
jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。
Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options
の下にあるJDBC/ODBC タブを選択することで見つけることができます。
- Database:Databricks データベース名に設定。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- Token:個人用アクセストークンに設定(この値は、Databricks
インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます)。
Databricks のデータにクエリを実行
接続したテーブルにクエリを実行してみます。
関連コンテンツ