Pentaho Report Designer にGoogle Data Catalog データに連携して分析

Ready to get started?

Download for a free trial:

Download Now

Learn more:

Google Data Catalog JDBC Driver

Google Data Catalog データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。



Pentaho BI ツールでGoogle Data Catalog のレポートを作成。



CData JDBC Driver for Google Data Catalog はダッシュボードや帳票ツールからリアルタイムGoogle Data Catalog データへの連携を可能にします。この記事では、Google Data Catalog をJDBC データソースとして接続する方法と、Pentaho でGoogle Data Catalog を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいGoogle Data Catalog 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:googledatacatalog: 次にセミコロン区切りで接続プロパティを入力します。

      Google Data Catalog uses the OAuth authentication standard. Authorize access to Google APIs on behalf on individual users or on behalf of users in a domain.

      Before connecting, specify the following to identify the organization and project you would like to connect to:

      • OrganizationId: The ID associated with the Google Cloud Platform organization resource you would like to connect to. Find this by navigating to the cloud console.

        Click the project selection drop-down, and select your organization from the list. Then, click More -> Settings. The organization ID is displayed on this page.

      • ProjectId: The ID associated with the Google Cloud Platform project resource you would like to connect to.

        Find this by navigating to the cloud console dashboard and selecting your project from the Select from drop-down. The project ID will be present in the Project info card.

      When you connect, the OAuth endpoint opens in your default browser. Log in and grant permissions to the application to completes the OAuth process. For more information, refer to the OAuth section in the Help documentation.

      以下は一般的なJDBC URL です:

      jdbc:googledatacatalog:ProjectId=YourProjectId;
    • Custom Driver Class Name:cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。

レポートに Google Data Catalog データを追加

これで、Google Data Catalog の帳票を作成する準備が整いました。

  1. 帳票にGoogle Data Catalog データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Schemas テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。