ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →Databricks Driver の30日間無償トライアルをダウンロード
30日間の無償トライアルへCData
こんにちは!テクニカルディレクターの桑島です。
Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for Databricks と組み合わせると、Denodo ユーザーはリアルタイムDatabricks データと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でDatabricks の仮想データソースを作成する手順を紹介します。
最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムDatabricks データを扱う上で比類のないパフォーマンスを提供します。Databricks にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をDatabricks に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってDatabricks データを操作および分析できます。
Denodo からリアルタイムDatabricks データに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。
Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。
jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
Database URI の作成については以下を参照してください。
JDBC URL の作成の補助として、Databricks JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.databricks.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。
Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。
データソースを作成したら、Denodo Platform で使用するDatabricks データの基本ビューを作成できます。
SELECT * FROM cdata_databricks_customers CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムDatabricks データを操作できるようになります。例えば、Denodo Data Catalog でDatabricks にクエリを実行できます。
CData JDBC Driver for Databricks の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムDatabricks データの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。