各製品の資料を入手。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
PostgreSQL には多くの対応クライアントがあります。標準のドライバーからBI、アナリティクスツールまで、PostgreSQL はデータ接続の人気のインターフェースです。JDBC ドライバーを使用することで、簡単に任意の標準クライアントから接続できるPostgreSQL エントリポイントを作成できます。
Parquet にPostgreSQL データベースとしてアクセスするには、CData JDBC Driver for Parquet とJDBC foreign data wrapper (FDW) を使用します。この記事ではFDW をコンパイルしてインストールし、PostgreSQL サーバーからParquet にクエリを実行します。
JDBC データソースとしてParquet に接続するには、以下が必要です。
Driver クラス
cdata.jdbc.parquet.ParquetDriver
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
JDBC URL の構成については、Parquet JDBC Driver に組み込まれている接続文字列デザイナを使用できます。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的なJDBC URL です。
jdbc:parquet:URI=C:/folder/table.parquet;
FDW は、PostgreSQL を再コンパイルせずに、PostgreSQL の拡張機能としてインストールできます。例としてjdbc2_fdw 拡張子を使用します。
ln -s /usr/lib/jvm/java-6-openjdk/jre/lib/amd64/server/libjvm.so /usr/lib/libjvm.so
make install USE_PGXS=1
拡張機能をインストールした後、以下のステップに従ってParquet へのクエリの実行を開始します。
CREATE EXTENSION jdbc2_fdw;
CREATE SERVER Parquet
FOREIGN DATA WRAPPER jdbc2_fdw OPTIONS (
drivername 'cdata.jdbc.parquet.ParquetDriver',
url 'jdbc:parquet:URI=C:/folder/table.parquet;',
querytimeout '15',
jarfile '/home/MyUser/CData/CData\ JDBC\ Driver\ for\ Salesforce MyDriverEdition/lib/cdata.jdbc.parquet.jar');
CREATE USER MAPPING for postgres SERVER Parquet OPTIONS (
username 'admin',
password 'test');
postgres=# CREATE FOREIGN TABLE sampletable_1 (
sampletable_1_id text,
sampletable_1_Id text,
sampletable_1_Column1 numeric)
SERVER Parquet OPTIONS (
table_name 'sampletable_1');
postgres=# SELECT * FROM sampletable_1;
このようにCData JDBC Driver for Parquet を使って簡単にParquet のデータを取得して検索対象にすることができました。ぜひ、30日の無償評価版 をお試しください。