Tableau Online でSpark ビジュアライゼーションを構築

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData Connect



CData Connect Cloud を使用してSpark の仮想SQL Server データベースを作成し、Tableau Online でビジュアライゼーションを構築します。

Tableau Online は、クラウドで完全にホストされている分析プラットフォームです。CData Connect Cloud と組み合わせることで、ビジュアライズやダッシュボ-ドなどのためにSpark データにクラウド間で瞬時にアクセスできるようになります。この記事では、Tableau Online でSpark の仮想データベースを作成し、Spark データからビジュアライゼーションを構築する方法を説明します。

CData Connect Cloud は、ピュアSQL Server のクラウド間インターフェースをSpark に提供することで、コネクタをインストールしたりTableau Desktop からワークシートやデータソースを公開したりすることなく、Tableau Online のライブSpark データからビジュアライゼーションを簡単に構築できるようにします。ビジュアライゼーションを構築すると、Tableau Online はデータを収集するためのSQL クエリを生成します。CData Connect Cloud は最適化されたデータ処理を使用し、サポートされているすべてのSQL 操作(フィルタ、JOINs など)をSpark に直接プッシュし、サーバー側の処理を利用してSpark データをすばやく返します。

Spark データの仮想SQL Server データベースを作成する

CData Connect Cloud は、シンプルなポイントアンドクリックインターフェースを使用してデータソースに接続し、API を生成します。

  1. Connect Cloud にログインし、「Databases」をクリックします。
  2. 「Available Data Sources」から「Spark」を選択します。
  3. Spark に接続するために必要な認証プロパティを入力します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

  4. Test Database」をクリックします。
  5. 「Privileges」->「 Add」とクリックし、適切な権限を持つ新しいユーザー(または既存のユーザー) を追加します。

仮想データベースが作成されたら、Tableau Online でビジュアライゼーションを構築できます。

Tableau Online でライブSpark データをビジュアライズ

以下のステップでは、Connect Cloud の仮想Spark データベースに基づいてTableau Online で新しいデータソースを作成し、データから簡単なビジュアライゼーションを構築する方法の概要を説明します。

  1. Tableau Online にログインし、プロジェクトを選択して新しいワークブックを作成します。
  2. 新しいワークブックで、データウィザードから「Microsoft SQL Server Connector」を選択し、Connect Cloud インスタンスの値を入力します。

  3. NOTE:「Require SSL」チェックボックスを有効化してください。
  4. 新しく作成したデータベースと、ビジュアライズするテーブルを選択します。(必要に応じて結合されたテーブルの関係を定義します。)
  5. 「Dimensions and Measures」を選択して、ビジュアライゼーションを構成します。

クラウドアプリケーションからSpark データへのSQL アクセス

この時点で、Tableau Online ワークブックからライブSpark への、クラウド間の直接接続が有効になります。Tableau Desktop から、データソースやワークブックを発行することなく、新しいビジュアライゼーションの作成やダッシュボードの構築などを行うことができます。Tableau Online などのクラウドアプリケーションから、100 を超えるSaaS、Big Data、NoSQL ソースのデータにSQL でアクセスする方法については、Connect Cloud ページを参照してください。