Ready to get started?

Learn more about the CData JDBC Driver for Apache Spark or download a free trial:

Download Now

Pentaho Report Designer にSpark Data を繋いでみた

Pentaho BI ツールでSpark data のレポートを作成。



CData JDBC Driver for Spark data はダッシュボードや帳票ツールからライブデータへのアクセスを可能にします。この記事では、Spark data をJDBC データソースとして接続する方法と、Pentaho でSpark data を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいSpark 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:sparksql: 次にセミコロン区切りで接続プロパティを入力します。

      Set the Server, Database, User, and Password connection properties to connect to SparkSQL.

      以下は一般的なJDBC URL です:

      jdbc:sparksql:Server=127.0.0.1;
    • Custom Driver Class Name:cdata.jdbc.sparksql.SparkSQLDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。

レポートに Spark Data を追加

これで、Spark data の帳票を作成する準備が整いました。

  1. 帳票にSpark データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT City, Balance FROM Customers
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Customers テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。
 
 
ダウンロード