DBVisualizer で Spark データに連携しクエリを作成

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark JDBC Driver

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。



DBVisualizer のビジュアルデータ分析ツールやデータ接続ウィザードにSpark を連携。



CData JDBC Driver for Spark は、JDBC 標準に準拠し、BI ツールからIDE まで幅広いアプリケーションでSpark への接続を提供します。この記事では、DbVisualizer からSpark に接続する方法、およびtable エディタを使ってSpark を ロード、 する方法を説明します。

※製品について詳しい情報をご希望の方は以下からお進みください。

Spark データの新しいJDBC データソースを作成

下記の手順に従って、Driver Manager を使ってDbVisualizer ツールからSpark に接続します。

  1. DbVisualizer で[Tools]>[Driver Manager]>[Create a New Driver]をクリックします。
  2. データソースに名前を入力します。
  3. [URL Format]ボックスに以下を入力します: jdbc:sparksql:
    DbVisualizer Driver Manager
  4. [User Specified]タブで[User Specified]ボタンをクリックし、インストールディレクトリの[lib]サブフォルダ内のcdata.jdbc.sparksql.jar ファイルを選択します。
  5. [Driver Class]メニューでSparkSQLDriver クラス、cdata.jdbc.sparksql.SparkSQLDriver を選択します。

JDBC データソースへの接続を定義

下記の手順に従って、JDBC URL に接続プロパティを入力します。

  1. [Database] タブで[Database Connection]ノードを右クリックし、[Create a Database Connection]をクリックします。
  2. [Connection]セクションで以下のオプションを設定します:

    • Database Type:ウィザードオプションを選択した場合は、データベースの種類は自動検出される。ウィザードを使用しないオプションを選択した場合は、[Database Type]メニューから[Generic]または[Auto Detect]オプションを選択。
    • Driver:先ほど作成したドライバーを選択。
    • Database URL:フルJDBC URL を入力。JDBC URL シンタックスは以下のとおりです。 jdbc:sparksql: 次に、セミコロン区切りでname-value ペアの接続プロパティを入力します。

      SparkSQL への接続

      SparkSQL への接続を確立するには以下を指定します。

      • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
      • Port:SparkSQL インスタンスへの接続用のポートに設定。
      • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
      • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

      Databricks への接続

      Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

      • Server:Databricks クラスターのサーバーのホスト名に設定。
      • Port:443
      • TransportMode:HTTP
      • HTTPPath:Databricks クラスターのHTTP パスに設定。
      • UseSSL:True
      • AuthScheme:PLAIN
      • User:'token' に設定。
      • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

      一般的な接続文字列は次のとおりです。

      jdbc:sparksql:Server=127.0.0.1;
    • Database UserId:Spark を認証するユーザーネーム。
    • Database Password:Spark を認証するパスワード。
  3. [Connection]タブで[Connect]をクリックします。

QuickBooks JDBC Driver が表示するテーブルをブラウズするには、テーブルを右クリックし[Open In New Tab]をクリックします。

SQL クエリの実行には、SQL Commander ツールを使います:[SQL Commander]>[New SQL Commander]をクリックします。利用可能なメニューから[Database Connection]、[Database]、[Schema]を選択します。

サポートされるSQL についての詳細は、ヘルプドキュメントの「サポートされるSQL」をご覧ください。テーブルに関する情報は「データモデル」をご覧ください。