製品をチェック

Apache Spark Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark JDBC Driver 相談したい

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。

Spark データをSisense でビジュアライズ

Spark にアクセスできるSisense アプリでElastiCube を作成します。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-04-14
spark ロゴ

CData

jdbc ロゴ画像
Sisense ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

Sisense を使用すると、データを結合、分析、画像化lし、よりインテリジェントなビジネス決定を行い、効果的な戦略を作成できます。CData JDBC Driver for SparkSQL は、Sisense に簡単に統合して利用することができます。この記事では、Spark に接続するElastiCube の作成方法と、それを使用してSisense のSpark をビジュアライズする方法を説明します。

Spark への接続を構成する

ElastiCube を作成する前に、JDBC Driver のJAR ファイル(通常はC:\Program Files\CDatat\CData JDBC Driver for SparkSQL\lib) のインストール場所をメモするか、jar ファイル(cdata.jdbc.sparksql.SparkSQL.jar) をSisense JDBC driver ディレクトリの新しいフォルダ(通常はC:\ProgramData\Sisense\DataConnectors\jdbcdrivers)にコピーします。

  1. Sisense アプリケーションの[Data]ページで、新しいElastiCube を作成します(または既存のElastiCube を開きます)。
  2. [Model Editor]で[+ Data]をクリックし、[Add Data]ダイアログボックスを開きます。
  3. [Generic JDBC]をクリックし、[JDBC settings]を開きます。 Connecting via JDBC
  4. [Connection String]プロパティをSpark のJDBC URL に設定し、必要なプロパティを追加します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、Spark JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.sparksql.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

    JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    以下は一般的な例です。

    jdbc:sparksql:Server=127.0.0.1;
  5. JDBC JAR フォルダプロパティをCData JDBC Driver JAR ファイルの場所に設定します(上記を参照)。
  6. ドライバーのクラス名をJDBC Driver のクラス名( cdata.jdbc.sparksql.SparkSQLDriver) に設定します。
  7. ユーザー名とパスワードのプロパティは空欄にします。
  8. [Next]をクリックします。 A configured connection in Sisense (HubSpot is shown).

Spark データをElastiCube に追加する

Spark に接続すると、ElastiCubeにテーブルとビューを追加できます。

  1. [Tables]リストから、and/or ビューどちらのテーブルを使用するか選択思案す。
  2. (オプション) [+]をクリックしてSQL でインポートするデータをカスタマイズします。
  3. [Done]をクリックします Selected tables to add to the ElastiCube
  4. [Build]をクリックし、分析用のElastiCube をビルドします。

Spark データをビジュアライズ

ElastiCube をSpark テーブルに追加することで、Spark で分析を実行できます。

  1. Sisense アプリケーションの[Analytics]ページに移動します。
  2. Dashboard を選択(または新規作成) します。
  3. Data Source を選択し、[Create]をクリックします。 Selecting the newly created ElastiCube
  4. [+ Select Data]をクリックし、ビジュアライゼーションに追加するフィールドを選択します。 Visualizing data in Sisense (HubSpot is shown).

CData JDBC Driver for SparkSQL を使用することで、Sisense でSpark に直接アクセスしてビジュアライズと分析を行うことができます。30日の無償評価版をダウンロードし、今すぐSisense でSpark を使用しましょう!

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。