本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →SnapLogic はintegration Platform-as-a-Service(iPaaS)であり、ユーザーはノーコードでデータ連携フローを作成できます。CData JDBC Drivers と組み合わせることで、ユーザーはSnapLogic ワークフローからParquet を含む250を超えるSaaS、ビッグデータ、NoSQL データソースのライブデータに接続できます。
組み込みの最適化されたデータ処理によって、CData JDBC Driver はライブParquet データを高速に扱えます。プラットフォームがParquet に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をParquet に直接プッシュし、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータソース型を使用してParquet データを操作することができます。
SnapLogic からParquet データに接続するには、CData Parquet JDBC Driver をダウンロードしてインストールします。インストール画面に従ってください。インストールが完了すると、インストール先のディレクトリ(デフォルトでは、C:/Program Files/CData/CData JDBC Driver for Parquet/lib)にJAR ファイルが作成されます。
インストール後、JDBC JAR ファイルをSnapLogic 内のディレクトリ(例えば、projects/Jerod Johnson)にManager タブからアップロードします。
JDBC Driver がアップロードされると、Parquet への接続を作成できます。
JDBC URL をParquet JDBC Driver 用のJDBC 接続文字列に設定します。例えば、
jdbc:parquet:URI=C:/folder/table.parquet;RTK=XXXXXX;です。
NOTE: RTK は評価版もしくは製品版のキーです。詳しくは、CData のサポートチームにご連絡ください。
JDBC URL の作成の補助として、Parquet JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。
java -jar cdata.jdbc.parquet.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
Connect to your local Parquet file(s) by setting the URI connection property to the location of the Parquet file.
接続を検証、適用後に開くフォームで、クエリを設定します。
Generic JDBC - Select snap を保存します。
接続とクエリを設定したら、snap の終端部分(以下のハイライト部分)をクリックしてデータをプレビューします。
結果が期待どおりのものであることを確認したら、他のsnap を追加してParquet データを別のエンドポイントに渡すこともできます。
本記事では、データをGoogle Spreadsheet にロードします。他のあらゆるサポートされているsnap が使用でき、Generic JDBC snap を他のCData JDBC Driver と利用してデータを外部サービスに移すこともできます。
これで、接続済みのパイプラインを実行してParquet からデータを抽出し、Google Spreadsheet にプッシュできます。
CData JDBC Driver for Parquet を使えば、Parquet データを外部サービスに連携するためのパイプラインをSnapLogic で作成できます。Parquet への接続に関する詳細については、CData のParquet 連携ページを参照してください。30日の無償評価版をダウンロードして今すぐ使い始めましょう。