Pentaho Report Designer にAmazon Athena データに連携して分析

Ready to get started?

Download for a free trial:

Download Now

Learn more:

Amazon Athena JDBC Driver

Amazon Athena 連携のパワフルなJava アプリケーションを素早く作成して配布。



Pentaho BI ツールでAmazon Athena のレポートを作成。



CData JDBC Driver for Amazon Athena はダッシュボードや帳票ツールからリアルタイムAmazon Athena データへの連携を可能にします。この記事では、Amazon Athena をJDBC データソースとして接続する方法と、Pentaho でAmazon Athena を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいAmazon Athena 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:amazonathena: 次にセミコロン区切りで接続プロパティを入力します。

      Amazon Athena への接続

      Amazon Athena リクエストの認証には、アカウントの管理のクレデンシャルか、IAM ユーザーのカスタムPermission を設定します。 AccessKey にAccess Key Id、SecretKey にはSecret Access Key を設定します。

      Note: AWS アカウントアドミニストレータとしてアクセスできる場合でも、AWS サービスへの接続にはIAM ユーザークレデンシャルを使用することが推奨されます。

      Access Key の取得

      IAM ユーザーのクレデンシャル取得は以下のとおり:

      1. IAM コンソールにログイン。
      2. Navigation ペインで[ユーザー]を選択。
      3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してから[セキュリティ認証情報]タブを選択。

      AWS ルートアカウントのクレデンシャル取得は以下のとおり:

      1. ルートアカウントの資格情報を使用してAWS 管理コンソールにサインイン。
      2. アカウント名または番号を選択し、表示されたメニューで[My Security Credentials]を選択。
      3. [Continue to Security Credentials]をクリックし、[Access Keys]セクションを展開して、ルートアカウントのアクセスキーを管理または作成。

      EC2 インスタンスからの認証

      EC2 インスタンスから本製品を使用していて、そのインスタンスにIAM ロールが割り当てられている場合は、認証にIAM ロールを使用できます。 これを行うには、UseEC2Roles をtrue に設定しAccessKeySecretKey を空のままにします。 本製品は自動的にIAM ロールの認証情報を取得し、それらを使って認証します。

      AWS ロールとして認証

      多くの場合、認証にはAWS ルートユーザーのダイレクトなセキュリティ認証情報ではなく、IAM ロールを使用することをお勧めします。 代わりにRoleARN を指定してAWS ロールを使用できます。これにより、本製品は指定されたロールの資格情報を取得しようと試みます。 (すでにEC2 インスタンスなどで接続されているのではなく)AWS に接続している場合は、役割を担うIAM ユーザーのAccessKeySecretKey を追加で指定する必要があります。AWS ルートユーザーのAccessKey およびSecretKey を指定する場合、 ロールは使用できません。

      MFA での認証

      多要素認証を必要とするユーザーおよびロールには、MFASerialNumber およびMFAToken 接続プロパティを指定してください。 これにより、本製品は一時的な認証資格情報を取得するために、リクエストでMFA 認証情報を送信します。一時的な認証情報の有効期間 (デフォルトは3600秒)は、TemporaryTokenDuration プロパティを介して制御できます。

      Amazon Athena への接続

      AccessKeySecretKey プロパティに加え、DatabaseS3StagingDirectoryRegion を設定します。Region をAmazon Athena データがホストされているリージョンに設定します。S3StagingDirectory をクエリの結果を格納したいS3内のフォルダに設定します。

      接続にDatabase が設定されていない場合は、本製品はAmazon Athena に設定されているデフォルトデータベースに接続します。

      以下は一般的なJDBC URL です:

      jdbc:amazonathena:AccessKey='a123';SecretKey='s123';Region='IRELAND';Database='sampledb';S3StagingDirectory='s3://bucket/staging/';
    • Custom Driver Class Name:cdata.jdbc.amazonathena.AmazonAthenaDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。

レポートに Amazon Athena データを追加

これで、Amazon Athena の帳票を作成する準備が整いました。

  1. 帳票にAmazon Athena データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT Name, TotalDue FROM Customers
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Customers テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。