製品をチェック

HDFS Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

HDFS アイコン HDFS JDBC Driver 相談したい

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

Pentaho Report Designer にHDFS データに連携して分析

Pentaho BI ツールでHDFS のレポートを作成。

加藤龍彦
デジタルマーケティング

最終更新日:2022-03-16
hdfs ロゴ

CData

jdbc ロゴ画像
Pentaho Report Designer ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。



CData JDBC Driver for HDFS はダッシュボードや帳票ツールからリアルタイムHDFS データへの連携を可能にします。この記事では、HDFS をJDBC データソースとして接続する方法と、Pentaho でHDFS を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいHDFS 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:hdfs: 次にセミコロン区切りで接続プロパティを入力します。

      HDFS 接続プロパティの取得・設定方法

      HDFS への認証には、次の接続プロパティを設定します。

      • Host:HDFS インスタンスのホストに設定してください。
      • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。

      以下は一般的なJDBC URL です:

      jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;
    • Custom Driver Class Name:cdata.jdbc.hdfs.HDFSDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。
    Required connection properties defined in the JDBC URL. (Salesforce is shown.)

レポートに HDFS データを追加

これで、HDFS の帳票を作成する準備が整いました。

  1. 帳票にHDFS データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT FileId, ChildrenNum FROM Files WHERE FileId = '119116' The query to retrieve data, specified in the JDBC data source configuration wizard. (Salesforce is shown.)
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Files テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。
A chart generated from up-to-date data. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。