MySQL Workbench でSpark データをクエリ

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark ODBC Driver

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。



MySQL Workbench からライブSpark データにMySQL クエリを実行します。

ODBC Driver for Spark からSQL Gateway を使用し、MySQL インターフェースを介してSpark にクエリを実行できます。以下のステップに従って、SQL Gateway のMySQL リモーティングサービスを開始し、MySQL Workbench でライブSpark を操作します。

Spark データへの接続

未指定の場合は、データソース名(DSN)で必要な接続プロパティの値を指定します。DSN を構成するために、ビルトインのMicrosoft ODBC Data Source Administrator を使用できます。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC データソースアドミニストレーターでDSN を作成及び設定する方法については、ヘルプドキュメントの[はじめに]チャプターを参照してください。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

SQL Gateway を構成する

Spark への接続を仮想MySQL データベースとして設定するには、SQL Gateway Overview を参照してください。クライアントからのMySQL 要求を受けるMySQL リモートサービスを構成します。このサービスは、SQL Gateway UI で構成できます。

MySQL Workbench からSpark をクエリ

以下のステップでは、MySQL Workbench からSQL Gateway で作成された仮想Spark データベースに接続し、ライブSpark データを操作するための基本的なクエリを発行する方法を説明します。

SQL Gateway を介してSpark に接続

  1. MySQL Workbench で、[add a new MySQL connection]をクリックします。
  2. 接続(CData SQL Gateway for Spark)に名前を付けます。
  3. HostnamePortUsername のパラメータを設定し、SQL Gateway に接続します。
  4. Store in Vault をクリックしてパスワードを設定し、保存します。
  5. Test Connection をクリックして接続が正しく構成されていることを確認し、OK をクリックします。

Spark データをクエリ

  1. 作成した接続(CData SQL Gateway for Spark)を開きます。
  2. [File]->[New Query Tab]と進みます。
  3. SELECT * FROM `CData SparkSQL Sys`.Customers; のようなSpark データを取得するSQL クエリを記述します。

MySQL Workbench からライブSpark データにアクセスすることで、MySQL データベースと同じようにSpark をクエリおよび更新できます。CData ODBC Driver for Spark とCData SQL Gateway の30日間無料トライアルはこちらです。