JBoss のコネクションプールからSpark データに連携

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark JDBC Driver

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。



Spark をJava サーブレットに統合します。JBoss のManagement Console を使用して、CData JDBC Driver for Spark をインストールします。

CData JDBC ドライバーは、コネクションプールの標準手順に従ってJBoss で構成できます。この記事では、JBoss アプリケーションのコネクションプールからSalesforce データにアクセスする方法について詳しく説明します。また、JBoss Management Interface を使用してCData JDBC Driver for Spark を設定する方法についても詳しく説明します。最後には、コネクションプールからSpark にアクセスできるようになります。

※製品について詳しい情報をご希望の方は以下からお進みください。

Management Console からJDBC Data Source for Spark を作成

以下のステップに従ってドライバーJAR を追加し、必要な接続プロパティを定義します。

  1. [Runtime]メニューで、展開先がマネージドドメインかスタンドアロンサーバーかに応じて[Domain]または[Server]メニューを選択し、[Manage deployments]をクリックして[Deployments]ページを開きます。
  2. [Add]をクリックします。表示されるウィザードで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルとライセンスを追加します。ウィザードをデフォルトで終了し、ドライバーを選択して[Enable]をクリックします。
  3. [Configuration]メニューで[Subsystems]->[Connector]->[Datasources]と進みます。これにより、JDBC データソースページが開きます。
  4. [Add]をクリックし、表示されるウィザードでドライバーとJNDI の名前を入力します。例: java:jboss/root/jdbc/SparkSQL
  5. 上で追加したドライバーを選択します。
  6. JDBC URL、ユーザー名、パスワードを入力します。JDBC URL の構文は、jdbc:sparksql: の後にセミコロンで区切られた接続プロパティのリストが続きます。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    以下は一般的な接続文字列です。

    jdbc:sparksql:Server=127.0.0.1;
  7. 接続を確認したらウィザードを終了します。Spark のデータソースを選択し、[Enable]をクリックします。

その他のJBoss 統合

上記のステップは、単純なコネクションプールのシナリオでドライバーを構成する方法を示しています。より詳しい情報については、JBoss EAP ドキュメントの[Data Source Management]の章を参照してください。