リアルタイム Athenaにデータ連携するレポートをPower BI で作成

Power BI connector を使ってAthena データをビジュアライズ

CData Power BI Connectors は、セルフサービスBI であるMicrosoft Power BI へのデータソースを拡充します。 CData Power BI Connector は、Power BI レポートにリアルタイムAthena をデータ連携します。 ダッシュボードでAthena データをモニタリングし、スケジューラーやリアルタイムででデータを更新することで、リアルタイムAthena データが反映されるようにできます。 ここでは、Power BI Connector を使用してMicrosoft Power BI Desktop でAthena のビジュアライゼーションを作成する方法について詳しく説明します。

PowerBI.com へのAthena レポートの発行の詳細については、弊社のナレッジベースをご参照ください。

コラボラティブ処理とメタデータ検出

CData Power BI Connectors は、Power BI からAthena へのハイパフォーマンスにデータ操作を実現します。コネクタには、データ処理を効率化するコラボラティブクエリ処理機能やメタデータ検出機能が組み込まれています。Power BI からAthena に複雑なSQL クエリを発行する場合、コネクタはデータソースでサポートされているSQL オペレーション(フィルタリングや集計など)をAthena に直接流し、サポートされていないSQL オペレーション(JOIN など)をクライアントであるコネクタ側で処理します。また、動的メタデータ検出機能により、Athena のテーブルやビューを検出するだけでなく、データ型を含めインポートするため、Power BI での分析が驚くほど簡単になります。

Power BI データソースとしてAthena を設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでAthena への接続を設定します。

接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。CData PowerBI REST DSN を選択します。 Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してAthena データに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。

Amazon Athena への接続

Amazon Athena リクエストの認証には、アカウントの管理のクレデンシャルか、IAM ユーザーのカスタムPermission を設定します。 AccessKey にAccess Key Id、SecretKey にはSecret Access Key を設定します。

Note: AWS アカウントアドミニストレータとしてアクセスできる場合でも、AWS サービスへの接続にはIAM ユーザークレデンシャルを使用することが推奨されます。

Access Key の取得

IAM ユーザーのクレデンシャル取得は以下の通り:

  1. IAM コンソールにログイン
  2. Navigation ペインでUsers を選択。
  3. To create or manage the access keys for a user, select the user and then select the Security Credentials tab.

To obtain the credentials for your AWS root account, follow the steps below:

  1. Sign into the AWS Management console with the credentials for your root account.
  2. Select your account name or number and select My Security Credentials in the menu that is displayed.
  3. Click Continue to Security Credentials and expand the Access Keys section to manage or create root account access keys.

Authenticating from an EC2 Instance

If you are using the CData Data Provider for Amazon Athena 2018 from an EC2 Instance and have an IAM Role assigned to the instance, you can use the IAM Role to authenticate. To do so, set UseEC2Roles to true and leave AccessKey and SecretKey empty. The CData Data Provider for Amazon Athena 2018 will automatically obtain your IAM Role credentials and authenticate with them.

Authenticating as an AWS Role

In many situations it may be preferable to use an IAM role for authentication instead of the direct security credentials of an AWS root user. An AWS role may be used instead by specifying the RoleARN. This will cause the CData Data Provider for Amazon Athena 2018 to attempt to retrieve credentials for the specified role. If you are connecting to AWS (instead of already being connected such as on an EC2 instance), you must additionally specify the AccessKey and SecretKey of an IAM user to assume the role for. Roles may not be used when specifying the AccessKey and SecretKey of an AWS root user.

Authenticating with MFA

For users and roles that require Multi-factor Authentication, specify the MFASerialNumber and MFAToken connection properties. This will cause the CData Data Provider for Amazon Athena 2018 to submit the MFA credentials in a request to retrieve temporary authentication credentials. Note that the duration of the temporary credentials may be controlled via the TemporaryTokenDuration (default 3600 seconds).

Connecting to Amazon Athena

In addition to the AccessKey and SecretKey properties, specify Database, S3StagingDirectory and Region. Set Region to the region where your Amazon Athena data is hosted. Set S3StagingDirectory to a folder in S3 where you would like to store the results of queries.

If Database is not set in the connection, the data provider connects to the default database set in Amazon Athena.

Athena テーブルをPower BI からクエリ

次の手順でAthena からデータをPower BI からクエリできるようにします:

  1. Power BI Desktop を開き、[データ]->[データを取得]->[その他]-> CData AmazonAthena を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
  2. CData PowerBI Athena を[Data Source Name]欄に入力します。データ接続モードを選択します:
    インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
    DirectQuery リモートデータに直接アクセスする場合。
  3. ナビゲーターダイアログで使用するテーブルを選択します。
  4. [データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。

    • カラムのデータ型の変更
    • カラムの削除
    • カラムのグルーピング

    Power BI は、コネクタが取得・検出したAthena のカラム毎のデータ型をそのまま使えます。

    Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Athena からデータを取得します。

    [読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。

データビジュアライゼーションを作成

データをPower BI から取得したら、レポートビューで取得したAthena フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

チャートの右上をクリックしてソートオプションを変更することもできます。

チャートの部分のハイライトも可能です。

取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。

[更新]をクリックするとその時点でのリアルタイムデータをAthena から取得してレポートに反映させることができます。

このように簡単にPower BI でAthena データをソースとするレポートが作成できました。CData Power BI Connector の30日の無償試用版を是非お試しください。

 
 
ダウンロード