ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →Apache Spark Driver の30日間無償トライアルをダウンロード
30日間の無償トライアルへCData
こんにちは!リードエンジニアの杉本です。
DataSpider Servista は、異なるシステムのデータやアプリケーションをノンプログラミングで「つなぐ」データインテグレーションプラットフォームです。
CData JDBC ドライバはDataSpider Servista において、JDBC データソースとして利用することが可能です。通常のJDBC の検索・更新などのアイコンを使って、標準SQL でSaaS/Web DB のデータを扱うことを可能にします。 この記事では、DataSpider で CData JDBC Driverを利用してSpark データに外部データとしてSQL でアクセスする方法を紹介します。
SparkSQL への接続を確立するには以下を指定します。
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
あとは通常のRDB コンポーネントのように、Spark データを扱うことが可能です。ツールパレットのJDBC からSQL 実行やストアドプロシージャ実行コンポーネントが使用できます。
例えばSpark データの取得であれば、検索系SQL実行処理を使って、SELECT 文でSpark データを抽出することができます。
このようにCData JDBC ドライバを使って、簡単にDataSpider でSpark データ データをノーコードで連携利用することができます。
CData JDBC Driver for SparkSQL 30日の無償評価版 をダウンロードして、お試しください。