Dundas BI でSpark データに連携するダッシュボードを構築

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark ODBC Driver

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。



ダイナミックダッシュボードを作成し、Dandus BI からSpark データを分析します。.

CData ODBC Driver for Spark を使えば、Spark に標準ODBC でのアクセスが可能になり、いろいろなBI、帳票、ETL ツールからデータ連携が可能になります。本記事では、Dundas BI からSpark データにGeneric ODBC として接続し、レポートやダッシュボードを作成します。

Spark データへの接続

  1. 未指定の場合は、データソース名(DSN)で必要な接続プロパティの値を指定します。ビルトインのデータソースアドミニストレーターを使用してDSN を設定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC データソースアドミニストレーターでDSN を作成及び設定する方法については、ヘルプドキュメントの[Getting Started]チャプターを参照してください。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数が制限されるため、可視化やレポートをデザインする際のパフォーマンスを向上させるのに役立ちます。

  2. Dundas BI インターフェースでメニューを開き、[New][Data Connector]をクリックします。
  3. Dundas BI Data Connector を構成します。
    • Data Connector に名前を付けます。
    • Data Provider として[ODBC generic]を選択します。
    • [Use System DSN]のチェックボックスにチェックを入れます。
    • 適切なSystem DSN を選択します。

Spark データをダッシュボードに追加する

これで、Spark を使用してダッシュボードを作成することができます。

  1. ホームページに移動します。
  2. [Explore Data]をクリックします。
  3. 適切なData Connector を展開します。
  4. 関連するデータを[Connector]からパネルにドラッグします。
    • 追加する[table]全体を選択できますが、適切な可視化を作成するために、Metric Set から[Measures/Rows]を削除する必要があるかもしれません。もしくは、可視化に含めるフィールドのみを選択することもできます。
    • フィールドを選択すると、Measures とRows に任意のフィルタまたは条件を追加して可視化をさらにカスタマイズできます。
  5. メニューバーから[Re-visualize]をクリックし、データに適切な可視化を選択します。
  6. [Add To New Dashboard]をクリックして可視化を新しいダッシュボードに追加します。
  7. ダッシュボードを構成し、Spark の動的な可視化を作成します。