Birst でSpark Data のビジュアライゼーションを構築

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark JDBC Driver

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。



CData JDBC Driver for Spark とBirst クラウドエージェントを使用して、Birst でSpark data のリアルタイムの視覚化を構築します。

Birst は、組織が複雑なプロセスを迅速に理解し、最適化することを支援するクラウドビジネスインテリジェンス(BI)ツールおよび分析プラットフォームです。CData JDBC Driver for Spark と組み合わせると、Birst Cloud Agent を経由してリアルタイムSpark data に接続し、ビジュアライズを構築できます。ここでは、Cloud Agent を使用してSpark に連携し、Birst で動的レポートを作成する方法を段階的に説明します。

強力なデータ処理機能により、CData JDBC Driver はBirst のSpark data 操作に高いパフォーマンスを提供します。Birst からSpark への複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作を直接Spark にプッシュし、組込みSQL エンジンを利用してクライアント側でサポートしない操作を処理します。組み込みの動的メタデータクエリにより、JDBC ドライバーはネイティブのBirst データ型を使用してSpark data を視覚化および分析することを可能にします。


※製品について詳しい情報をご希望の方は以下からお進みください。

Birst でSpark Data へのJDBC 接続を設定

Birst プロジェクトを作成する前に、JDBC Driver を操作するためのBirst Cloud Agent をインストールする必要があります。また、JDBC ドライバーのJAR ファイル(および存在する場合はLIC ファイル)をCloud Agent のインストール場所の/drivers/ ディレクトリにコピーします。

ドライバーとCloud Agent のインストールが完了したら、開始できます。

  1. Birst で新しいプロジェクトを作成します。
  2. 接続に名前を付けます。(e.g. CDataSparkSQL)
  3. Live Access を選択します。
  4. エージェントを選択します。
  5. Database Type をOther に設定します。
  6. SQL タイプをMSSQL に設定します。
  7. 接続文字列を設定します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    ビルトイン接続文字列デザイナー

    JDBC URL の構成については、Spark JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.sparksql.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    JDBC URL を構成する際、Max Rows 接続プロパティを設定することもできます。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    以下はSpark の一般的なJDBC 接続文字列です。

    jdbc:sparksql:Server=127.0.0.1;
  8. Driver Name cdata.jdbc.sparksql.SparkSQLDriver を設定し、[Save]をクリックします。

NOTE Spark への認証は接続文字列に管理されるため、[Security Credentials]は空白でも問題ありません。

Spark Data オブジェクトを設定

接続が構成されたら、データセットのスキーマを構成し、ビジュアライズするテーブル、ビュー、そしてカラムを選択することができるようになります。

  1. スキーマを選択します。 (e.g. SparkSQL)
  2. [Tables]や[Views]をクリックしてこれらのエンティティに接続し、[Apply]をクリックします。
  3. アクセスする[Tables]と[Columns]を選択し、[Done]をクリックします。

オブジェクトが構成されたら、Pronto Prepare and Relate ツールを用いて、データ準備の実行やデータのリレーションを検出できるようになります。

ビジュアライゼーションを構築

データを準備し、接続されたオブジェクト間のリレーションを定義することで、ビジュアライゼーションを構築することができるようになります。

  1. メニューから、Visualizer ツールを選択します。
  2. オブジェクトからMeasures & Categories を選択します。
  3. 選択したMeasure(s) に適切なビジュアライゼーションを選択し、構成します。

CData JDBC Driver for Spark をCloud Agent やBirst とともに用いることにより、Spark で簡単に堅牢なビジュアライゼーションとレポートを作成できます。無料の30日間トライアルをダウンロードし、Birst ビジュアライゼーションの構築を開始してください。