製品をチェック

製品の詳細・30日間の無償トライアルはコチラ

CData Connect

Tableau Cloud でAzure Data Lake Storage ビジュアライゼーションを構築

CData Connect Server を使用してAzure Data Lake Storage の仮想SQL Server データベースを作成し、Tableau Cloud でビジュアライゼーションを構築します。

加藤龍彦
ウェブデベロッパー

最終更新日:2022-10-31

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Tableau Cloud は、クラウドで完全にホストされている分析プラットフォームです。CData Connect Server と組み合わせることで、ビジュアライズやダッシュボ-ドなどのためにAzure Data Lake Storage データに瞬時にアクセスできるようになります。この記事では、Tableau Cloud でAzure Data Lake Storage の仮想データベースを作成し、Azure Data Lake Storage データからビジュアライゼーションを構築する方法を説明します。

CData Connect Server は、ピュアSQL Server インターフェースをAzure Data Lake Storage に提供することで、コネクタをインストールしたりTableau Desktop からワークシートやデータソースを公開したりすることなく、Tableau Cloud のリアルタイムAzure Data Lake Storage データからビジュアライゼーションを簡単に構築できるようにします。ビジュアライゼーションを構築すると、Tableau Cloud はデータを収集するためのSQL クエリを生成します。CData Connect Server は最適化されたデータ処理を使用し、サポートされているすべてのSQL 操作(フィルタ、JOINs など)をAzure Data Lake Storage に直接プッシュし、サーバー側の処理を利用してAzure Data Lake Storage データをすばやく返します。

ホスティングについて

Tableau Cloud からCData Connect Server に接続するには、利用するConnect Server インスタンスをネットワーク経由での接続が可能なサーバーにホスティングして、URL での接続を設定する必要があります。CData Connect がローカルでホスティングされており、localhost アドレス(localhost:8080 など)またはローカルネットワークのIP アドレス(192.168.1.x など)からしか接続できない場合、Tableau Cloud はCData Connect Server に接続することができません。

クラウドホスティングでの利用をご希望の方は、AWS MarketplaceGCP Marketplace で設定済みのインスタンスを提供しています。


Azure Data Lake Storage データの仮想SQL Server データベースを作成する

CData Connect Server は、シンプルなポイントアンドクリックインターフェースを使用してデータソースに接続し、API を生成します。

  1. Connect Server にログインし、「Databases」をクリックします。 データベースを追加
  2. 「Available Data Sources」から「Azure Data Lake Storage」を選択します。
  3. Azure Data Lake Storage に接続するために必要な認証プロパティを入力します。

    Azure DataLakeStorage 接続プロパティの取得・設定方法

    Azure DataLakeStorage Gen 1 への接続

    Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen1 を指定。
    • Account:アカウント名に設定。
    • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 1 への認証

    Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

    Azure DataLakeStorage Gen 2 への接続

    Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

    • SchemaADLSGen2 に設定。
    • Account:ストレージアカウント名に設定。
    • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
    • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

    Azure DataLakeStorage Gen 2 への認証

    Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

    アクセスキーを使用した認証

    アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

    Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

    1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定で「アクセスキー」を選択します。
    3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

    Configuring a connection (Salesforce is shown).
  4. Test Database」をクリックします。
  5. 「Permission」->「 Add」とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー) を追加します。

仮想データベースが作成されたら、Tableau Cloud でビジュアライゼーションを構築できます。

Tableau Cloud でリアルタイムAzure Data Lake Storage データをビジュアライズ

以下のステップでは、Connect Server の仮想Azure Data Lake Storage データベースに基づいてTableau Cloud で新しいデータソースを作成し、データから簡単なビジュアライゼーションを構築する方法の概要を説明します。

  1. Tableau Cloud にログインし、プロジェクトを選択して新しいワークブックを作成します。
  2. 新しいワークブックで、データウィザードから「Microsoft SQL Server Connector」を選択し、Connect Server インスタンスの値を入力します。

  3. NOTE:「Require SSL」チェックボックスを有効化してください。 Connect to Connect Server from Tableau Cloud
  4. 新しく作成したデータベースと、ビジュアライズするテーブルを選択します。(必要に応じて結合されたテーブルの関係を定義します。)
  5. Choosing a Database and Tables
  6. 「Dimensions and Measures」を選択して、ビジュアライゼーションを構成します。
  7. Visualizing Azure Data Lake Storage データ in Tableau Cloud

アプリケーションからAzure Data Lake Storage データへのSQL アクセス

この時点で、Tableau Cloud ワークブックからリアルタイムAzure Data Lake Storage への直接接続が有効になります。Tableau Desktop から、データソースやワークブックを発行することなく、新しいビジュアライゼーションの作成やダッシュボードの構築などを行うことができます。Tableau Cloud などのクラウドアプリケーションから、100 を超えるSaaS、Big Data、NoSQL ソースのデータにSQL でアクセスする方法については、Connect Server ページを参照してください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。