製品をチェック

製品の詳細・30日間の無償トライアルはコチラ

CData Connect

Azure Data Lake Storage データをPower BI Service にインポートしてビジュアライズ

CData Connect Server を使用してAzure Data Lake Storage のOData フィードを作成し、Power BI Service でカスタムレポートを作成します。

加藤龍彦
ウェブデベロッパー

最終更新日:2022-01-03

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Power BI を使えば会社のデータを美しいビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect Serverと組み合わせることで、ビジュアライゼーションやダッシュボードなどのためにAzure Data Lake Storage データを使用できます。この記事では、CData Connect Server を使用してAzure Data Lake Storage のOData フィードを生成し、Azure Data Lake Storage データをPower BI にインポートして、Azure Data Lake Storage データを使ったレポートをPower BI サービスで作成する方法について説明します。

注意:Connect Server のオンプレミスデータゲートウェイとSQL インターフェースを使って(データをインポートする代わりに)リアルタイムでAzure Data Lake Storage データに接続することもできます。詳細については、関連するKnowledge Base の記事を参照してください。

Azure Data Lake Storage データの仮想SQL データベースを作成

CData Connect Server は、簡単なポイントアンドクリックインターフェースを使用してAPI を生成します。

  1. Connect Server にログインし、「Databases」をクリックします。 データベースを追加
  2. 「Available Data Sources」から「Azure Data Lake Storage」を選択します。
  3. 必要な認証プロパティを入力し、Azure Data Lake Storage に接続します。

    Azure DataLakeStorage 接続プロパティの取得・設定方法

    Azure DataLakeStorage Gen 1 への接続

    Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen1 を指定。
    • Account:アカウント名に設定。
    • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 1 への認証

    Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

    Azure DataLakeStorage Gen 2 への接続

    Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen2 に設定。
    • Account:ストレージアカウント名に設定。
    • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 2 への認証

    Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

    アクセスキーを使用した認証

    アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

    Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

    1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定で「アクセスキー」を選択します。
    3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

    Configuring a connection (Salesforce is shown).
  4. Test Database」をクリックします。
  5. 「Permission」->「 Add」とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー)を追加します。

Power BI からConnect Server に接続

Power BI サービスにAzure Data Lake Storage データをインポートしてビジュアライズするには、Connect Server API ユーザーを追加してConnect Server にAzure Data Lake Storage OData エンドポイントを追加し、Power BI Desktop からサービスにデータセットを作成して公開します。

Connect Server ユーザーの追加

Power BI からConnect Server を介してAzure Data Lake Storage に接続するユーザーを作成します。

  1. [Users]->[ Add]とクリックします。
  2. ユーザーを構成します。 Creating a new user
  3. [Save Changes]をクリックして新しいユーザーの認証トークンをメモします。 Connect Server users
  4. 「Database」をクリックし、Azure Data Lake Storage 仮想データベースを選択します。
  5. 「Permission」タブで、新規作成した(少なくともSELECT 権限を持つ)ユーザーを追加して「Save Changes」をクリックします。 Adding Permission

Connect Server にAzure Data Lake Storage OData エンドポイントを追加

Azure Data Lake Storage に接続したら、目的のテーブルのOData エンドポイントを作成します。

  1. [OData]->[Tables]->[Add Tables]とクリックします。
  2. Azure Data Lake Storage データベースを選択します。
  3. 使用するテーブルを選択し、[Next]をクリックします。 Selecting a Table (Salesforce is shown)
  4. (オプション)テーブルの定義を編集して特定のフィールドなどを選択します。
  5. 設定を保存します。

Power BI デスクトップからデータセットを公開

Connect Server にOData エンドポイントを追加すると、OData 接続を使用してPower BI デスクトップにデータセットを作成し、そのデータセットをPower BI サービスに公開できます。

  1. Power BIを開いて「Get Data」->「More」とクリックし、OData フィードを選択して「Connect」をクリックします。
  2. Create a new connection in Power BI
  3. URL をConnect Server インスタンスのBase URL(例: CONNECT_SERVER_URL/api.rsc)に設定し、「OK」をクリックします。
  4. User namePassword を上記のユーザー名と認証トークンに設定します。
  5. 設定を適用するレベルとして、フルのBase URL(CONNECT_SERVER_URL/api.rsc)を選択します。 Connect to CData Connect Server instance
  6. 「Navigator」ダイアログでテーブルを選択し、ビジュアライズします。
  7. 「Load」をクリックしてPower BI にデータをプルします。
  8. 「Relationships」タブで選択したエンティティ間の関係性を定義します。
  9. 「Home」メニューから「Publish」をクリックして「Workspace」を選択します。

Power BI Service のAzure Data Lake Storage データでレポートとダッシュボードを作成

Power BI サービスにデータセットを公開したので、公開されたデータを使って新しいレポートとダッシュボードを作成できます。

  1. PowerBI.com にログインします。
  2. 「Workspaces」をクリックし、ワークスペースを選択します。
  3. 「Create」をクリックし、「Report」を選択します。
  4. レポートに使用する公開済みデータセットを選択します。 Select a dataset
  5. フィールドとビジュアライゼーションを選択してレポートを追加します。 Visualizing Azure Data Lake Storage データ in the Power BI service

アプリケーションからAzure Data Lake Storage データへSQL でアクセス

Power BI サービスからリアルタイムAzure Data Lake Storage データへの直接接続ができるようになりました。これで、Azure Data Lake Storage を複製することなく多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。

アプリケーションから直接250+ SaaS 、Big Data 、NoSQL ソースへのSQL データアクセスを取得するには、CData Connect Server を参照してください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。