各製品の資料を入手。
詳細はこちら →CData
こんにちは!テクニカルディレクターの桑島です。
Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for Databricks と組み合わせると、Denodo ユーザーはリアルタイムDatabricks データと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でDatabricks の仮想データソースを作成する手順を紹介します。
最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムDatabricks データを扱う上で比類のないパフォーマンスを提供します。Databricks にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をDatabricks に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってDatabricks データを操作および分析できます。
Denodo からリアルタイムDatabricks データに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。
Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。
jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
Database URI の作成については以下を参照してください。
JDBC URL の作成の補助として、Databricks JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.databricks.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。
Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。
データソースを作成したら、Denodo Platform で使用するDatabricks データの基本ビューを作成できます。
SELECT * FROM cdata_databricks_customers CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムDatabricks データを操作できるようになります。例えば、Denodo Data Catalog でDatabricks にクエリを実行できます。
CData JDBC Driver for Databricks の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムDatabricks データの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。