Impala をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。
この記事では、Talend で簡単にCData JDBC driver for Impala をワークフローに統合してImpala データ連携する方法を説明します。ここではCData JDBC Driver for Impala を使ってTalend でImpala をジョブフローに転送します。
※製品について詳しい情報をご希望の方は以下からお進みください。
- Impala にほかのBI、ETL、開発ツールから接続したい:Impala データ連携ガイドおよびチュートリアルのリストへ
- Impala Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
JDBC データソースとしてTalend でImpala に接続
下記の手順に従って、Impala にJDBC 接続を確立します:
- Impala を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
- ウィザードが表示されたら、接続に名前を入力します。
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
In order to connect to Apache Impala, set the Server, Port, and ProtocolVersion. You may optionally specify a default Database. To connect using alternative methods, such as NOSASL, LDAP, or Kerberos, refer to the online Help documentation.
以下は一般的なJDBC URL です:
jdbc:apacheimpala:Server=127.0.0.1;Port=21050;
- インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.apacheimpala.jar ファイルへのパスを入力します。
- 接続を右クリックして[Retrieve Schema]をクリックします。
- デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
- デフォルトオプションでウィザードを終了します。

Customers テーブルをフラットファイルに出力
下記の手順に従って、Customers テーブルをフラットファイル出力コンポーネントに転送します:
- [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
- ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
- 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
- Customers tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。
プロジェクトを実行してデータを転送します。