HDFS データに連携しTalend からデータに接続

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS JDBC Driver

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。



HDFS をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。



この記事では、Talend で簡単にCData JDBC driver for HDFS をワークフローに統合してHDFS データ連携する方法を説明します。ここではCData JDBC Driver for HDFS を使ってTalend でHDFS をジョブフローに転送します。

※製品について詳しい情報をご希望の方は以下からお進みください。

JDBC データソースとしてTalend でHDFS に接続

下記の手順に従って、HDFS にJDBC 接続を確立します:

  1. HDFS を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
  2. ウィザードが表示されたら、接続に名前を入力します。
  3. 次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。

    In order to authenticate, set the following connection properties:

    • Host: Set this value to the host of your HDFS installation.
    • Port: Set this value to the port of your HDFS installation. Default port: 50070

    以下は一般的なJDBC URL です:

    jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
  4. インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.hdfs.jar ファイルへのパスを入力します。
  5. 接続を右クリックして[Retrieve Schema]をクリックします。
  6. デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
  7. デフォルトオプションでウィザードを終了します。

Files テーブルをフラットファイルに出力

下記の手順に従って、Files テーブルをフラットファイル出力コンポーネントに転送します:

  1. [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
  2. ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
  3. 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
  4. Files tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。

プロジェクトを実行してデータを転送します。