リアルタイム Redshiftにデータ連携するレポートをPower BI で作成

Power BI connector を使ってRedshift データをビジュアライズ

CData Power BI Connectors は、セルフサービスBI であるMicrosoft Power BI へのデータソースを拡充します。 CData Power BI Connector は、Power BI レポートにリアルタイムRedshift をデータ連携します。 ダッシュボードでRedshift データをモニタリングし、スケジューラーやリアルタイムででデータを更新することで、リアルタイムRedshift データが反映されるようにできます。 ここでは、Power BI Connector を使用してMicrosoft Power BI Desktop でRedshift のビジュアライゼーションを作成する方法について詳しく説明します。

PowerBI.com へのRedshift レポートの発行の詳細については、弊社のナレッジベースをご参照ください。

コラボラティブ処理とメタデータ検出

CData Power BI Connectors は、Power BI からRedshift へのハイパフォーマンスにデータ操作を実現します。コネクタには、データ処理を効率化するコラボラティブクエリ処理機能やメタデータ検出機能が組み込まれています。Power BI からRedshift に複雑なSQL クエリを発行する場合、コネクタはデータソースでサポートされているSQL オペレーション(フィルタリングや集計など)をRedshift に直接流し、サポートされていないSQL オペレーション(JOIN など)をクライアントであるコネクタ側で処理します。また、動的メタデータ検出機能により、Redshift のテーブルやビューを検出するだけでなく、データ型を含めインポートするため、Power BI での分析が驚くほど簡単になります。

Power BI データソースとしてRedshift を設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでRedshift への接続を設定します。

接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。CData PowerBI REST DSN を選択します。 Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してRedshift データに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。

Redshift への接続には次を設定します:

  • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
  • Port: クラスタのポート。
  • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
  • User: ユーザー名。
  • Password: ユーザーのパスワード。

Server およびPort の値はAWS の管理コンソールで取得可能です:

  1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
  2. Clusters ページで、クラスタ名をクリック。
  3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。

    Redshift テーブルをPower BI からクエリ

    次の手順でRedshift からデータをPower BI からクエリできるようにします:

    1. Power BI Desktop を開き、[データ]->[データを取得]->[その他]-> CData Redshift を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
    2. CData PowerBI Redshift を[Data Source Name]欄に入力します。データ接続モードを選択します:
      インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
      DirectQuery リモートデータに直接アクセスする場合。
    3. ナビゲーターダイアログで使用するテーブルを選択します。
    4. [データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。

      • カラムのデータ型の変更
      • カラムの削除
      • カラムのグルーピング

      Power BI は、コネクタが取得・検出したRedshift のカラム毎のデータ型をそのまま使えます。

      Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Redshift からデータを取得します。

      [読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。

    データビジュアライゼーションを作成

    データをPower BI から取得したら、レポートビューで取得したRedshift フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

    チャートの右上をクリックしてソートオプションを変更することもできます。

    チャートの部分のハイライトも可能です。

    取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。

[更新]をクリックするとその時点でのリアルタイムデータをRedshift から取得してレポートに反映させることができます。

このように簡単にPower BI でRedshift データをソースとするレポートが作成できました。CData Power BI Connector の30日の無償試用版を是非お試しください。

 
 
ダウンロード