BIRT Reports をSpark データ でデザイン

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark JDBC Driver

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。



現在のSpark を組み込み型アナリティクスに提供します。

CData JDBC Driver for Spark は、Spark APIs への接続をデータドリブンJava アプリケーションに統合します。CData JDBC Driver for Spark をBIRT (Business Intelligence Reporting Tools) のプラットホームで使用することで、リアルタイムでデータの変更を反映するBIRT レポートを作成できます。

  1. Eclipse 用のBIRT Framework プラグインとDatabase Development プラグインをインストールします。
  2. [File]->[New]->[Report]と進みます。[Report Design perspective]が表示されます。
  3. [Data Explorer]で[Data Sources]を右クリックし、[New Data Source]をクリックします。
  4. [Following List]オプションから[Create from Data Source Type]を選択し、[JDBC Data Source]を選択します。
  5. [Manage Drivers]をクリックし、インストールフォルダのlib サブフォルダにあるドライバーのJAR を追加します。
  6. [Database URL]ボックスに、接続文字列を含む[JDBC URL]を入力します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、Spark JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.sparksql.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    以下は一般的なJDBC URL です。

    jdbc:sparksql:Server=127.0.0.1;
  7. [Data Sets]フォルダを右クリックし、[JDBC data source for Spark]を選択します。
  8. 表示されるダイアログで、レポートのデータを取得するために使用するSELECT クエリを構築します。この記事では、以下のクエリを用います。 SELECT City, Balance FROM Customers
  9. [Palette]で、[Chart]をエディタにドラッグします。[Chart]ウィザードが表示されます。
  10. チャートタイプを選択した後、[Select Data]タブのチャートフィールドにカラムをドラッグします。
  11. [Run]->[View Report]->[In Web Viewer]とクリックして、レポートを表示します。

これによって、BIRT レポートがSpark の更新をすべて取得できるようになります。

レポートをアプリケーションサーバーに公開するには、ドライバーのJAR をBIRT Viewer のクラスパスに追加します。より詳しい説明は、Java アプリケーションサーバーにJDBC Driver をデプロイする方法について、CData KB を参照してください。