ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →30日間の無償トライアル
無償トライアルはこちら製品の詳細
Parquet データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。
桑島義行
テクニカルディレクター
こんにちは!テクニカルディレクターの桑島です。
Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for Parquet と組み合わせると、Denodo ユーザーはリアルタイムParquet データと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でParquet の仮想データソースを作成する手順を紹介します。
最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムParquet データを扱う上で比類のないパフォーマンスを提供します。Parquet にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をParquet に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってParquet データを操作および分析できます。
Denodo からリアルタイムParquet データに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。
Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。
jdbc:parquet:URI=C:/folder/table.parquet;
Database URI の作成については以下を参照してください。
JDBC URL の作成の補助として、Parquet JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
データソースを作成したら、Denodo Platform で使用するParquet データの基本ビューを作成できます。
SELECT * FROM cdata_parquet_sampletable_1 CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムParquet データを操作できるようになります。例えば、Denodo Data Catalog でParquet にクエリを実行できます。
CData JDBC Driver for Parquet の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムParquet データの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。