Parquet のデータに連携しTalend からデータに接続
Parquet をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。
古川えりか
コンテンツスペシャリスト
最終更新日:2022-09-15
CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、Talend で簡単にCData JDBC Driver for Parquet をワークフローに統合してParquet のデータ連携する方法を説明します。ここではCData JDBC Driver for Parquet を使ってTalend でParquet をジョブフローに転送します。
JDBC データソースとしてTalend でParquet に接続
下記の手順に従って、Parquet にJDBC 接続を確立します:
- Parquet を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
- ウィザードが表示されたら、接続に名前を入力します。
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
Parquet 接続プロパティの取得・設定方法
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
以下は一般的なJDBC URL です:
jdbc:parquet:URI=C:/folder/table.parquet;
- インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.parquet.jar ファイルへのパスを入力します。
- 接続を右クリックして[Retrieve Schema]をクリックします。
- デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
- デフォルトオプションでウィザードを終了します。
SampleTable_1 テーブルをフラットファイルに出力
下記の手順に従って、SampleTable_1 テーブルをフラットファイル出力コンポーネントに転送します:
- [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
- ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
- 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
- SampleTable_1 tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。
プロジェクトを実行してデータを転送します。
関連コンテンツ