Google Data Studio(Data Portal) からAzure Data Lake Storage データに連携してレポートを作成

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData Connect



CData Connect Cloud を使ってAzure Data Lake Storage の仮想MySQL データベースを作成して、Google Data Studio(Data Portal)でAzure Data Lake Storage データを使ったカスタムレポートを作成します。

Google Data Studio は、大変使いやすいビジュアライゼーションとレポーティングが可能なサービスです。Google Data Studio とCData Connect Cloud を一緒に使うことで、簡単にAzure Data Lake Storage データに連携するレポートを作成することができます。この記事では、Google Data Studio とConnect Cloud でAzure Data Lake Storage に連携するシンプルなレポートを作成する方法を説明します。

CData Connect Cloud は、Azure Data Lake Storage データのクラウドto クラウドのインターフェースを提供し、Google Data Studio からリアルタイムAzure Data Lake Storage データに連携することができます。ビジュアライズを作成すると、Google Data Studio がクエリを自動的に発行してリアルタイムデータを取得します。CData Connect Cloud がクエリ(フィルタリングやJOIN も可能)をパースしてAzure Data Lake Storage に送り、Google Data Studio にAzure Data Lake Storage からのデータを返します。インテリジェントなサーバーサイドプロセスで、多様なクエリをパフォーマンス良く利用できます。

この設定には、CData Connect Cloud インスタンスおよびCData Connect Cloud Connector for Google Data Studioが必要です。是非、https://www.cdata.com/jp/connect からCData Connect Cloud のトライアルと詳細情報をご覧ください。


CData Connect Cloud からAzure Data Lake Storage に接続

CData Connect Cloud は、直観的なPoint-and-click インターフェースでデータソースへの接続およびAPI エンドポイント作成を行います。

  1. Connect Cloud にログインして、Databases をクリックします。
  2. 利用できるデータソースアイコンから"Azure Data Lake Storage" を選択します。
  3. Azure Data Lake Storage に接続するために必要なプロパティを入力します。

    Authenticating to a Gen 1 DataLakeStore Account

    Gen 1 uses OAuth 2.0 in Azure AD for authentication.

    For this, an Active Directory web application is required. You can create one as follows:

    1. Sign in to your Azure Account through the .
    2. Select "Azure Active Directory".
    3. Select "App registrations".
    4. Select "New application registration".
    5. Provide a name and URL for the application. Select Web app for the type of application you want to create.
    6. Select "Required permissions" and change the required permissions for this app. At a minimum, "Azure Data Lake" and "Windows Azure Service Management API" are required.
    7. Select "Key" and generate a new key. Add a description, a duration, and take note of the generated key. You won't be able to see it again.

    To authenticate against a Gen 1 DataLakeStore account, the following properties are required:

    • Schema: Set this to ADLSGen1.
    • Account: Set this to the name of the account.
    • OAuthClientId: Set this to the application Id of the app you created.
    • OAuthClientSecret: Set this to the key generated for the app you created.
    • TenantId: Set this to the tenant Id. See the property for more information on how to acquire this.
    • Directory: Set this to the path which will be used to store the replicated file. If not specified, the root directory will be used.

    Authenticating to a Gen 2 DataLakeStore Account

    To authenticate against a Gen 2 DataLakeStore account, the following properties are required:

    • Schema: Set this to ADLSGen2.
    • Account: Set this to the name of the account.
    • FileSystem: Set this to the file system which will be used for this account.
    • AccessKey: Set this to the access key which will be used to authenticate the calls to the API. See the property for more information on how to acquire this.
    • Directory: Set this to the path which will be used to store the replicated file. If not specified, the root directory will be used.
  4. Test Database をクリックします。
  5. Privileges -> Add をクリックして、新しいユーザーを追加し、適切な権限を指定します。

これで、Azure Data Lake Storage の仮想データベースが作成でき、Google Data Studio からの連携が可能になりました。

Google Data Studio からリアルタイムAzure Data Lake Storage データにアクセスしてビジュアライズを作成

以下の手順で、Google Data Studio でCData Connect Cloud を使って、Azure Data Lake Storage データのビジュアライゼーションを作成します。

  1. Google Data Studio にログインして、データソース、新しいデータソースとクリックし、CData Connect Cloud Connector を選択します。
  2. Connector に権限を許可します。
  3. (myinstancemyinstance.cdatacloud.net)、username、password を入力してCData Connect にアクセスします。
    • Username: myinstance/username
    • Password: your Connect Cloud password
  4. Database (e.g. ADLS1) を選択して、Next をクリックします。
  5. Table (e.g. Resources) を選択します。
  6. Connect をクリックします。
  7. 必要があれば、カラムを変更できます。Create Report をクリックして、データを取得します。
  8. あとは通常のRDB などのデータと同じようにスタイルを選択してビジュアライズを作成します。
  9. Dimensions およびMeasures を選択していきます。

Optional:MySQL Connector への接続

もしカスタムSQL クエリを使いたい場合には、MySQL Connector を使うことで実現が可能です。Server アドレス、ポート、ユーザー名、パスワードのサーバー情報を使ってCData Connect Cloud に接続します。

クラウドアプリケーションからAzure Data Lake Storage データにSQL アクセスを実現

このようにGoogle Data Studio からAzure Data Lake Storage データにクラウドto クラウドでの連携ができました。CData Connect では、他にも多くのデータソースに対応しています。

クラウドアプリケーションから240+ SaaS、BigData、NoSQL にSQL でデータ連携するには、CData Connect Cloud を是非お試しください。