JBoss のコネクションプールからSpark のデータに連携

Spark をJava サーブレットに統合します。JBoss のManagement Console を使用して、CData JDBC Driver for SparkSQL をインストールします。

加藤龍彦
デジタルマーケティング

最終更新日:2022-09-12

この記事で実現できるSpark 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData JDBC ドライバーは、コネクションプールの標準手順に従ってJBoss で構成できます。この記事では、JBoss アプリケーションのコネクションプールからSalesforce データにアクセスする方法について詳しく説明します。また、JBoss Management Interface を使用してCData JDBC Driver for SparkSQL を設定する方法についても詳しく説明します。最後には、コネクションプールからSpark にアクセスできるようになります。

Management Console からJDBC Data Source for SparkSQL を作成

以下のステップに従ってドライバーJAR を追加し、必要な接続プロパティを定義します。

  1. [Runtime]メニューで、展開先がマネージドドメインかスタンドアロンサーバーかに応じて[Domain]または[Server]メニューを選択し、[Manage deployments]をクリックして[Deployments]ページを開きます。
  2. [Add]をクリックします。表示されるウィザードで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルとライセンスを追加します。ウィザードをデフォルトで終了し、ドライバーを選択して[Enable]をクリックします。 The deployed JAR.(Salesforce is shown.)
  3. [Configuration]メニューで[Subsystems]->[Connector]->[Datasources]と進みます。これにより、JDBC データソースページが開きます。
  4. [Add]をクリックし、表示されるウィザードでドライバーとJNDI の名前を入力します。例: java:jboss/root/jdbc/SparkSQL
  5. 上で追加したドライバーを選択します。
  6. JDBC URL、ユーザー名、パスワードを入力します。JDBC URL の構文は、jdbc:sparksql: の後にセミコロンで区切られた接続プロパティのリストが続きます。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    以下は一般的な接続文字列です。

    jdbc:sparksql:Server=127.0.0.1;
  7. 接続を確認したらウィザードを終了します。Spark のデータソースを選択し、[Enable]をクリックします。
The enabled data source.(Salesforce is shown.)

その他のJBoss 統合

上記のステップは、単純なコネクションプールのシナリオでドライバーを構成する方法を示しています。より詳しい情報については、JBoss EAP ドキュメントの[Data Source Management]の章を参照してください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。