Pentaho Report Designer にHDFS データに連携して分析

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS JDBC Driver

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。



Pentaho BI ツールでHDFS のレポートを作成。



CData JDBC Driver for HDFS はダッシュボードや帳票ツールからリアルタイムHDFS データへの連携を可能にします。この記事では、HDFS をJDBC データソースとして接続する方法と、Pentaho でHDFS を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいHDFS 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:hdfs: 次にセミコロン区切りで接続プロパティを入力します。

      In order to authenticate, set the following connection properties:

      • Host: Set this value to the host of your HDFS installation.
      • Port: Set this value to the port of your HDFS installation. Default port: 50070

      以下は一般的なJDBC URL です:

      jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
    • Custom Driver Class Name:cdata.jdbc.hdfs.HDFSDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。

レポートに HDFS データを追加

これで、HDFS の帳票を作成する準備が整いました。

  1. 帳票にHDFS データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT FileId, ChildrenNum FROM Files WHERE FileId = '119116'
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Files テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。