Metabase でSpark データに連携するインタラクティブなダッシュボードを作成

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData Connect



CData Connect Cloud を使ってSpark データの仮想MySQL エンドポイントを作成して、Metabase からSpark データを使ったインタラクティブダッシュボードを作成する方法。

Metabase は、ユーザーがインタラクティブなダッシュボードを作成できるオープンソースソフトウェアのデータ可視化ツールです。Metabase とCData Connect Cloud を一緒に使うことで、簡単にSpark データに連携したビジュアライズ、ダッシュボードを作成することができます。この記事では、CData Connect Cloud を経由してMetabase からSpark に連携するダッシュボードを作成する方法を説明します。

CData Connect Cloud は、Spark データのクラウド to クラウドの仮想MySQL インターフェースを提供し、Metabase からリアルタイムにSpark データへ連携することができます。Metabase に保存されたデータはスケジュールで更新可能で常にアップデートされたデータを保持することができます。

Spark の仮想MySQL データベースを作成

まずCData Connect Cloud でデータソースへの接続およびAPI エンドポイント作成を行います。

  1. CData Connect Cloud にログインして、Databases をクリックします。
  2. 利用できるデータソースアイコンから"Spark" を選択します。
  3. Spark に接続するために必要なプロパティを入力します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

  4. Test Database をクリックします。
  5. Privileges -> Add をクリックして、新しいユーザーを追加し、適切な権限を指定します。

Metabase にCData Connect Cloud のデータベースを追加

続いてCData Connect Cloud へのデータベース接続をMetabase に追加します。Metabase では MySQLインターフェースを用いてCData Connect Cloudに接続します。

  1. 管理画面に移動して、「データベース」タブから「データベースを追加」をクリックします。
  2. データベースのタイプから「MySQL」を選択して以下の通りCData Connect Cloud への接続に必要な情報を入力し、「保存」をクリックします。この時に「セキュア接続を使用しますか?」をONにします。
  3. 入力後設定を保存することで、CData Connect Cloud 経由でSpark への接続が確立されます。

Metabase でSpark データをクエリする

それでは実際にMetabase からSpark のデータを取得してみましょう。

  1. データの取得にはクエリエディタを使用します。
  2. クエリエディタにSQL を記述することで、CData Connect Cloud を経由し、Metabase にSpark のデータをロードできます。
  3. あとは、「ビジュアライゼーション」の画面に移動して、取得したSpark のデータを元にグラフを作成できます。
  4. 以下のようにビジュアライズができました。

クラウドアプリケーションからSpark データにSQL アクセスを実現

このようにMetabase からSpark データにクラウド-to-クラウドでの連携ができました。これで簡単にビジュアライズ、やダッシュボード作成が可能です。他にも多くのSaaS に対応するCData Connect Cloud の詳細をConnect Cloud からご覧ください。