今すぐお試しください!

製品の詳細CData JDBC Driver for Apache Hive を確認して、無償評価版をダウンロード:

今すぐダウンロード

Pentaho Report Designer にHive データに連携して分析

Pentaho BI ツールでHive のレポートを作成。



CData JDBC Driver for Hive はダッシュボードや帳票ツールからリアルタイムHive データへの連携を可能にします。この記事では、Hive をJDBC データソースとして接続する方法と、Pentaho でHive を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいHive 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:apachehive: 次にセミコロン区切りで接続プロパティを入力します。

      Apache Hive への接続を確立するには以下を指定します。

      • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
      • Port:HiveServer2 インスタンスへの接続用のポートに設定。
      • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
      • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
      • 本製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

      以下は一般的なJDBC URL です:

      jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
    • Custom Driver Class Name:cdata.jdbc.apachehive.ApacheHiveDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。

レポートに Hive データを追加

これで、Hive の帳票を作成する準備が整いました。

  1. 帳票にHive データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT City, CompanyName FROM Customers
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Customers テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。
 
 
ダウンロード