製品をチェック

Apache Spark Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark JDBC Driver 相談したい

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。

Aqua Data Studio からSpark データに連携

Spark データにAqua Data Studio のVisual Query Builder やTable Data Editor からデータ連携。

加藤龍彦
ウェブデベロッパー

最終更新日:2022-08-10
spark ロゴ

CData

jdbc ロゴ画像
Aqua Data Studio ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData JDBC Driver for SparkSQL は、Aqua Data Studio のようなIDE のウィザード・アナリティクスにSpark データを統合します。本記事では、Spark データをコネクションマネージャーに接続してクエリを実行する手順を説明します。

JDBC Data Source の設定

コネクションマネージャーで、新しいJDBC データソースとして、接続プロパティ設定を行い、保存します。Spark データがAqua Data Studio ツールから使えるようになります。

  1. Aqua Data Studio で、Server メニューから Register Server を選択します。
  2. Register Server フォームで、 'Generic - JDBC' コネクションを選びます。
  3. 次のJDBC 接続プロパティを設定します:
    • Name:任意の名前、データソースの名前など。
    • Driver Location:Browse ボタンをクリックして、インストールディレクトリのlib フォルダの cdata.jdbc.sparksql.jar ファイルを選択します。
    • Driver:クラス名に cdata.jdbc.sparksql.SparkSQLDriver を入力。
    • URL:jdbc:sparksql: から始まるJDBC URL を入力します。接続プロパティをカンマ区切りで書きます。接続プロパティの詳細は、ヘルプドキュメントを参照してください。一般的な接続文字列は:

      jdbc:sparksql:Server=127.0.0.1;
    The JDBC data source, defined by the JAR path, driver class, and JDBC URL.(QuickBooks is shown.)
  4. SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

Spark データにクエリを実行

接続したテーブルにクエリを実行してみます。

A query executed in the Table Data Editor.(QuickBooks is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。