本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →JDBC 標準を使用してconnectをParquet に接続することにより、基準のスキルを活用します。 Oracle Data Integrator (ODI) ののようなETL ツールへのドロップイン統合により、CData JDBC Driver for Parquet は、リアルタイムParquet をデータウェアハウスやビジネスインテリジェンス、Big Data テクノロジーに接続します。
JDBC 接続により、ODI の他のデータベースと同じようにParquet を操作できます。RDBMS と同様に、フラットファイルを操作する代わりに、ドライバーを使用してParquet API にリアルタイムで直接接続できます。
この記事では、JDBC ベースのParquet データのETL からOracle へのロードまでについてを説明します。Parquet エンティティのデータモデルをリバースエンジニアリングした後、マッピングを作成し、データ読み込み戦略を選択します。ドライバーはSQL-92 をサポートしているため、この最後のステップは、組み込みのSQL からSQL Loading Knowledge Module をセンタすることで簡単に実行できます。
ドライバーをインストールするには、インストールフォルダにあるドライバーJAR を.lic ファイルをODI userlib ディレクトリにコピーします。
Unix:
~/.odi/oracledi/userlib
Windows
%APPDATA%\Roaming\odi\oracledi\userlib
ODI を再起動してインストールを完了します。
モデルをリバースエンジニアリングすると、Parquet のドライバーのリレーショナルビューに関するメタデータが取得されます。リバースエンジニアリング後、リアルタイムのParquet をクエリし、Parquet テーブルに基づいてマッピングを作成できます。
Connect to your local Parquet file(s) by setting the URI connection property to the location of the Parquet file.
JDBC URL の構成については、Parquet JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
jdbc:parquet:URI=C:/folder/table.parquet;
リバースエンジニアリング後、ODI でParquet を操作できるようになります。
Parquet を表示するには、Designer ナビゲーターでモデルアコーディオンを展開し、テーブルを右クリックして[View data]をクリックします。
以下のステップに従って、Parquet からETL を作成します。SampleTable_1 エンティティをODI Getting Started VM に含まれているサンプルデータウェアハウスにロードします。
SQL Developer を開き、Oracle データベースに接続します。[Connections]ペインでデータベースのノードを右クリックし、[New SQL Worksheet]をクリックします。
もしくは、SQLPlus を使用することもできます。コマンドプロンプトから、以下のように入力します。
sqlplus / as sysdba
CREATE TABLE ODI_DEMO.TRG_SAMPLETABLE_1 (COLUMN1 NUMBER(20,0),Id VARCHAR2(255));
これで、マッピングを実行してParquet をOracle にロードできます。