Amazon Athena のデータをリアルタイムでPowerBI.com にパブリッシュ(発行)

CData Power BI Connectors をPowerBI.com に接続するオンプレミスゲートウェイでリアルタイムデータを組織内で使用可能に。

古川えりか
コンテンツスペシャリスト

最終更新日:2025-01-30

この記事で実現できるAmazon Athena 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData Power BI Connector for AmazonAthena は、Power BI のツールおよびウイザードにシームレスに統合します。PowerBI.com へのリアルタイムデータのパブリッシュも可能です。次のステップで、Power BI Gateway を使って、自動リフレッシュ設定で、データをPower BI サービスに公開します。

Amazon Athena をPower BI のデータソースに設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでAmazon Athena への接続を設定します。

接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。システムDSN のCData PBI Amazon Athena Sys を選択します。

Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してAmazon Athena のデータに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。

Amazon Athena 接続プロパティの取得・設定方法

Amazon Athena リクエストの認証には、アカウントの管理のクレデンシャルか、IAM ユーザーのカスタムPermission を設定します。 AccessKey にAccess Key Id、SecretKey にはSecret Access Key を設定します。

AWS アカウントアドミニストレータとしてアクセスできる場合でも、AWS サービスへの接続にはIAM ユーザークレデンシャルを使用することが推奨されます。

IAM ユーザーのクレデンシャル取得は以下のとおり:

  1. IAM コンソールにログイン。
  2. Navigation ペインで「ユーザー」を選択。
  3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してから「セキュリティ認証情報」タブを選択。

AWS ルートアカウントのクレデンシャル取得は以下のとおり:

  1. ルートアカウントの資格情報を使用してAWS 管理コンソールにサインイン。
  2. アカウント名または番号を選択し、表示されたメニューで「My Security Credentials」を選択。
  3. 「Continue to Security Credentials」をクリックし、「Access Keys」セクションを展開して、ルートアカウントのアクセスキーを管理または作成。

EC2 インスタンスからの認証

EC2 インスタンスからCData 製品を使用していて、そのインスタンスにIAM ロールが割り当てられている場合は、認証にIAM ロールを使用できます。 これを行うには、UseEC2Roles をtrue に設定しAccessKeySecretKey を空のままにします。 CData 製品は自動的にIAM ロールの認証情報を取得し、それらを使って認証します。

AWS ロールとして認証

多くの場合、認証にはAWS ルートユーザーのダイレクトなセキュリティ認証情報ではなく、IAM ロールを使用することをお勧めします。 代わりにRoleARN を指定してAWS ロールを使用できます。これにより、CData 製品は指定されたロールの資格情報を取得しようと試みます。 (すでにEC2 インスタンスなどで接続されているのではなく)AWS に接続している場合は、役割を担うIAM ユーザーのAccessKeySecretKey を追加で指定する必要があります。AWS ルートユーザーのAccessKey およびSecretKey を指定する場合、 ロールは使用できません。

MFA での認証

多要素認証を必要とするユーザーおよびロールには、MFASerialNumber およびMFAToken 接続プロパティを指定してください。 これにより、CData 製品は一時的な認証資格情報を取得するために、リクエストでMFA 認証情報を送信します。一時的な認証情報の有効期間 (デフォルトは3600秒)は、TemporaryTokenDuration プロパティを介して制御できます。

Amazon Athena への接続

AccessKeySecretKey プロパティに加え、DatabaseS3StagingDirectoryRegion を設定します。Region をAmazon Athena データがホストされているリージョンに設定します。S3StagingDirectory をクエリの結果を格納したいS3内のフォルダに設定します。

接続にDatabase が設定されていない場合は、CData 製品はAmazon Athena に設定されているデフォルトデータベースに接続します。

Amazon Athena テーブルをPower BI からクエリ

次の手順でAmazon Athena からデータをPower BI からクエリできるようにします:

  1. Power BI Desktop を開き、[ホーム]->[データを取得]->[詳細…]->[その他]-> CData AmazonAthena(カスタム)を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
  2. CData PBI Amazon Athena Sys を[Data Source Name]欄に入力します。データ接続モードを選択します:
    インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
    DirectQuery リモートデータに直接アクセスする場合。
  3. ナビゲーターダイアログで使用するテーブルを選択します。 The available tables. (Salesforce is shown.)
  4. [データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。

    • カラムのデータ型の変更
    • カラムの削除
    • カラムのグルーピング

    Power BI は、コネクタが取得・検出したAmazon Athena のカラム毎のデータ型をそのまま使えます。

    Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Amazon Athena からデータを取得します。

    [読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。

データビジュアライゼーションを作成

データをPower BI から取得したら、レポートビューで取得したAmazon Athena フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

A pie chart showing Account Names and Annual Revenue from Salesforce.

チャートの右上をクリックしてソートオプションを変更することもできます。

チャートの部分のハイライトも可能です。

A highlighted account in a pie chart. (Salesforce is shown.)

取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。

Accounts and Annual Revenue filtered by Industry. (Salesforce is shown.)

[更新]をクリックするとその時点でのリアルタイムデータをAmazon Athena から取得してレポートに反映させることができます。

オンプレミスデータゲートウェイでのPowerBI.com へのデータリフレッシュの設定

次の手順でPower BI オンプレミスゲートウェイ を使って、ローカルに設定したDSN で取得するAmazon Athena のデータをPower BI のクラウド上から定期的にリフレッシュすることが可能です。

ゲートウェイモードの選択

まずはゲートウェイのモードを選択します。

  • ゲートウェイ (個人用モード): Power BI サービスにのみパブリッシュしてリフレッシュする場合はこちらを選択。ゲートウェイはWindows ユーザーアカウントで起動します。
  • ゲートウェイ (標準モード): ほかのAzure サービスでゲートウェイが必要な場合には、こちらを選択します。また、複数のユーザーがゲートウェイにアクセスする場合にも標準モードゲートウェイが必要です。
    標準モードゲートウェイでアクセスする場合にはシステムDSN で接続する必要があります。ユーザーDSN だと特定のアカウントしかアクセスできなく、システムDSN のようにシステム全体からアクセスすることができないためです。システムDSN のCData PBI AmazonAthena Sys は、ODBC データソースアドミニストレータで設定します。

個人用モードゲートウェイの設定

個人用モードでのゲートウェイでのパブリッシュは、カスタムコネクタにアクセスできるゲートウェイをインストールする必要があります。

  1. インストーラーをこちらから ダウンロードして実行します。
  2. on-premises data gateway (personal mode) を起動します。
  3. ゲートウェイにサインインします。
  4. コネクタセクションで、カスタムデータコネクタオプションを有効化します。.pqx ファイルが置かれたパスを指定し、フォルダーからカスタムデータコネクタを読み込みます。
    Note: CData Power BI Connectors は、デフォルトフォルダ(Your User Home\Documents\Power BI Desktop\Custom Connectors)に.pqx ファイルをインストールします。

標準モードゲートウェイの設定

ゲートウェイ経由のパブリッシュには、コネクタへのアクセスが可能なゲートウェイのインストールとPowerBI.com からのAmazon Athena DSN への接続が必要です。

1. ゲートウェイのセットアップ

次の手順でマシン上にゲートウェイを設定します:

  1. Power BI Gateway インストーラーをダウンロード してインストールする必要です。
  2. on-premises data gateway を起動します。
  3. ゲートウェイにサインインします。
  4. ゲートウェイ名を設定し、回復キーを設定します。
  5. ゲートウェイがCData Power BI Connectors を見に行くフォルダを指定します。この記事では C:\Windows\ServiceProfiles\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使います。CData Power BI Connectors の.pqx ファイル(デフォルトフォルダはC:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\) を指定したフォルダにコピーします。

    NOTE: ゲートウェイのサービスアカウント(NT SERVICE\PBIEgwService) がアクセスできるフォルダに指定される必要があります。必要な場合には、ゲートウェイのサービスアカウントをサービス設定で変更できます。

  6. コネクタセクションで、CDataAmazonAthena が表示されていることを確認します。 CData Power BI Connectors in the On-Premises Data Gateway.

2. PowerBI.com からAmazon Athena のデータに接続

  1. PowerBI.com にログインして、設定メニューから[接続とゲートウェイの管理]画面を開きます。
  2. [オンプレミスデータゲートウェイ]タブからゲートウェイクラスターを選択し、設定をクリックします。
  3. [ユーザーのクラウドデータソースが、このゲートウェイクラスターを介して更新することを許可します]オプションを有効にします。
  4. 設定を保存します。
  5. 続いて[接続]タブでゲートウェイにCData Power BI Connectors のデータソースを[新規]接続として追加します。
  6. [新しい接続]パネルでオンプレミスの[ゲートウェイクラスター名]を選択し、[接続名]を指定します。
  7. [接続の種類]にはCData Power BI Connector for AmazonAthena をドロップダウンから選択します。
  8. [Data Source Name] には、システムDSN 名を入力します:CData PBI AmazonAthena Sys。
  9. [認証方法]には、DSN 構成で認証済みの場合は[匿名]を選択します。
  10. 設定後[作成]ボタンをクリックし、接続が[作成済み]と表示されれば、設定完了です。
  11. 接続リストの[状態]欄にある更新アイコンをクリックし、[オンライン]状態を確認します。

PowerBI.com へのパブリッシュ

これでAmazon Athena のデータソースに連携してデータを更新できるレポートが発行できます。次の手順でセマンティックモデルを含むレポートをパブリッシュします。

  1. Power BI Desktop で、[発行]ボタンを押して、レポートを指定されたPower BI のワークスペースにパブリッシュします。
  2. PowerBI.com で、発行したワークスペースを選択します。
  3. 設定したAmazon Athena のセマンティックモデルのオプションメニューをクリックして、[設定]をクリックします。
  4. [ゲートウェイとクラウド接続]セクションで、[データゲートウェイ接続]をオンにします。状態がグリーンであることを確認し、適用を押して保存します。
  5. 個人用モードゲートウェイを利用する場合は、[データソースの資格情報]をクリックして、サインインします。[認証方法]には、DSN 構成で認証済みの場合は[匿名]を選択します。

データの更新(リフレッシュ)

これでPower BI サイドからレポートのデータをAmazon Athena の最新のデータに更新できるようになりました。

  • データの手動更新には、[ワークスペース]からレポートのセマンティックモデルを開き、[更新]->[今直ぐ更新]をクリックします。
  • スケジュール更新には、[ワークスペース]からレポートのセマンティックモデルを開き、[更新]->[更新のスケジュール設定]をクリックします。データの更新オプションを有効にして、更新頻度を設定します。
  • レポートビューでは、更新を押してレポートを最新のデータに同期できます。

The uploaded Power BI report. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。