ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →Apache Spark Driver の30日間無償トライアルをダウンロード
30日間の無償トライアルへCData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、Talend で簡単にCData JDBC Driver for SparkSQL をワークフローに統合してSpark データ連携する方法を説明します。ここではCData JDBC Driver for SparkSQL を使ってTalend でSpark をジョブフローに転送します。
下記の手順に従って、Spark にJDBC 接続を確立します:
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
SparkSQL への接続を確立するには以下を指定します。
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
以下は一般的なJDBC URL です:
jdbc:sparksql:Server=127.0.0.1;
下記の手順に従って、Customers テーブルをフラットファイル出力コンポーネントに転送します:
プロジェクトを実行してデータを転送します。