Ready to get started?

Learn more about the CData JDBC Driver for Apache Spark or download a free trial:

Download Now

Apache Spark Data に接続しTalend からデータに接続

Apache Spark data をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。



この記事では、Talend で簡単にCData JDBC driver for Apache Spark をワークフローに統合する方法を説明します。ここではCData JDBC Driver for Apache Spark を使ってTalend でApache Spark data をジョブフローに転送します。

JDBC データソースとしてTalend でApache Spark に接続

下記の手順に従って、Apache Spark にJDBC 接続を確立します:

  1. Apache Spark data に新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
  2. ウィザードが表示されたら、接続に名前を入力します。
  3. 次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。

    Set the Server, Database, User, and Password connection properties to connect to SparkSQL.

    以下は一般的なJDBC URL です:

    jdbc:sparksql:Server=127.0.0.1;
  4. インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.sparksql.jar ファイルへのパスを入力します。
  5. 接続を右クリックして[Retrieve Schema]をクリックします。
  6. デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
  7. デフォルトオプションでウィザードを終了します。

Customers テーブルをフラットファイルに出力

下記の手順に従って、Customers テーブルをフラットファイル出力コンポーネントに転送します:

  1. [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
  2. ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
  3. 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
  4. Customers tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。

プロジェクトを実行してデータを転送します。

 
 
ダウンロード