製品をチェック

製品の詳細・30日間の無償トライアルはこちら

CData Connect

CData Connect Server を介してPower BI でリアルタイムAzure Data Lake Storage データの可視化を作成

CData Connect Server を使用してAzure Data Lake Storage データの仮想データベースを作成し、Power BI でカスタムレポートを作成します。

加藤龍彦
デジタルマーケティング

最終更新日:2021-02-05

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Power BI を使えば、データを美しいビジュアルに可視化したり、重要な情報を整理してダッシュボード化できます。CData Connect Server と組み合わせることで、可視化やダッシュボードなどのためにAzure Data Lake Storage データを使用できます。この記事では、CData Connect Server を使用してAzure Data Lake Storage の仮想データベースを作成し、Azure Data Lake Storage データを使ったレポートをPower BI で作成する方法を説明します。

Azure Data Lake Storage データの仮想データベースを作成する

CData Connect Server は、シンプルなポイントアンドクリックインターフェースを使用してデータソースに接続し、データを取得します。まずは、右側のサイドバーのリンクからConnect Server をインストールしてください。

  1. Connect Server にログインし、「CONNECTIONS」をクリックします。 データベースを追加
  2. 一覧から「Azure Data Lake Storage」を選択します。
  3. Azure Data Lake Storage に接続するために必要な認証プロパティを入力します。

    Azure DataLakeStorage 接続プロパティの取得・設定方法

    Azure DataLakeStorage Gen 1 への接続

    Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen1 を指定。
    • Account:アカウント名に設定。
    • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 1 への認証

    Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

    Azure DataLakeStorage Gen 2 への接続

    Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen2 に設定。
    • Account:ストレージアカウント名に設定。
    • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 2 への認証

    Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

    アクセスキーを使用した認証

    アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

    Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

    1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定で「アクセスキー」を選択します。
    3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

    コネクションを設定(Salesforce の場合)。
  4. Test Connection」をクリックします。
  5. 「Permission」->「 Add」とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー) を追加します。

仮想データベースが作成されたら、Power BI からAzure Data Lake Storage に接続して可視化することができます。

Power BI Connector のダウンロードと接続設定

次に、Connect Server とPower BI Desktop を連携するためのコネクタをインストールします。Connect Server の「CLIENTS」ページにある「Power BI Desktop」の「Download」をクリックすると、ダウンロードが開始します。完了したら、実行ファイルをクリックして製品をインストールしてください。

インストールが完了すると、以下の「DSN Configuration」画面が表示されます。この画面にCData Connect Server への接続に必要となる次の情報を入力します。

  • Auth Sceme:Basic
  • User:Connect Server で設定したユーザー名
  • Password:上記ユーザーのパスワード
  • URL:https://<Connect Server のURL>/rest.rsc/
  • Default Catalog:Connect Server で設定したコネクション名(Azure Data Lake Storage1 など)
  • (オプション)SSL Server Cert:サーバー側でSSL を設定していない場合のみ「*」
Connect Server への接続を設定

以上の設定が完了したら、「Test Connection」をクリックして接続をテストします。「The connection test was successful」などと表示されれば、接続テストは成功です。ここから実際にPower BI でデータを取得していきます。

Power BI からAzure Data Lake Storage テーブルをクエリ

以下のステップを実行して、Azure Data Lake Storage データを取得します。

  1. 「Power BI Desktop」を開いて「データを取得」画面を表示します。検索ボックスに「cdata connect」と入力すると「CData Connect」が表示されるので、これを選択して「接続」をクリックします。 デーを取得画面でCData Connect を選択
  2. PowerBI Connector の設定画面が表示されるので、「Data Source Name」に「Power BI Connect」と入力して「OK」をクリックします。 CData Connect のコネクタ名を入力
  3. ユーザー名とパスワードを入力するよう求められるので、CData Connect Server で設定したユーザー名とパスワードを入力して、「接続」をクリックします。 CData Connect のクレデンシャルを入力
  4. 「ナビゲーター」画面で取得したいテーブルを選択します。 取得したいテーブルを選択(Salesforce の例)
  5. 「読み込み」をクリックして、Power BI にデータをインポートします。

Azure Data Lake Storage データの可視化を作成

Power BI にデータを接続したら、「フィールド」ペインのフィールドをキャンバスにドラッグすることで、レポートビューにデータを可視化できます。図表の種類と、ビジュアライズするディメンションおよびメジャーを選択します。

Azure Data Lake Storage データをPower BI で可視化

「更新」をクリックしてデータの変更をレポートに同期します。

データアプリケーションからAzure Data Lake Storage データへのSQL アクセス

以上で、CData Connect Server を使用してPower BI からAzure Data Lake Storage データに接続できるようになりました。これで、Azure Data Lake Storage データを複製することなく多くのデータをインポートしたり、新しい可視化やレポートを作成することができます。

オンプレミスのBI やレポート、ETL、その他のデータアプリケーションから、250を超えるSaaS、ビッグデータ、NoSQL データソース(Azure Data Lake Storage を含む)への直接のSQL データにアクセスするには、CData Connect Server のページにアクセスして無料トライアルをダウンロードしてください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。