製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

Tableau Server へのSpark ダッシュボードの公開・パブリッシュ

CData ODBC Driver for SparkSQL を使って、Tableau ダッシュボードにSpark をデータ連携。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-09-20

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

エンタープライズBI にSpark 連携機能を追加しましょう。CData ODBC Driver for SparkSQL を使って、Tableau Server にSpark データをリアルタイム連携して、ダッシュボードを公開。企業の他のメンバーに連携レポート・ダッシュボードを共有しましょう。

この記事では、クライアントおよびサーバーでのでのDSN の設定、Spark のデータソースのTableau Server へのパブリッシュ、ワークブック全体のTableau Server へのパブリッシュまでの手順を説明します。データソースをパブリッシュすると、Tableau Server で更新可能なワークブックを新しく作成することができるようになります。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにSpark データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Tableau Server 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとSpark への接続設定

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

Tableau Desktop でワークブックやデータソースを作成して、Tableau Server にワークブックやデータソースをパブリッシュするには、デスクトップとサーバーのそれぞれのマシンでDSN 設定を行う必要があります。両方のマシンで厳密に同じ名前のDSN を作成して接続する必要があります。以下がSpark に接続するための情報です。Windows とLinux ODBC では設定に異なる点がありますので、ドキュメントを参照してください。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

Windows

CData ODBC Driver for SparkSQL on Windows の場合は、DSN 設定はドライバーをインストールした後に行います。ドライバーをインストール語にDSN 設定画面が開きます。マイクロソフトのODBC データソースアドミニストレータから設定を行うことも可能です。

Linux

CData ODBC Driver for SparkSQL をLinux で利用する場合には、ドライバーのインストールでSystem DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、接続プロパティを入力することでDSN 設定を変更することができます。

/etc/odbc.ini

[CData SparkSQL Source] Driver = CData ODBC Driver for SparkSQL Description = My Description Server = 127.0.0.1

コンフィグレーションファイルの詳細設定については、製品ヘルプを参照してください。

Spark データソースをTableau に公開

Spark への接続を確立したら、Tableau でSpark データソースをパブリッシュして、組織内のユーザーがSpark データに連携するワークブックを作成して利用できるようにします。

Tableau 上でSpark データソースを作成してパブリッシュする

  1. データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData SparkSQL Sys を選択します。

    ドライバーのインストール時にシステムDSN とユーザーDSN を自動的に作成してくれます。Tableau Server では、システムDSN を使用します。

    Tableau からDSN への接続 (Salesforce is shown.)
  2. [データベース]メニューでCData を選択します。
  3. [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。
  4. [データソース]ページで、テーブルをJOIN エリアにドラッグします。 使用するテーブルの選択(Salesforce is shown.)
  5. [サーバー]メニューで[ワークブックのパブリッシュ]-> (使用するデータソース)をクリックします。
  6. サーバーのURL を入力します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  7. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで、組織のユーザーがパブリッシュされたSpark データソースのワークブックを作成して共有することができるようになりました。

Tabelau Server でデータソースへの接続を設定 (Salesforce is shown.)

ワークブックのデータ更新(リフレッシュ)

クライアントマシンであるTableau Desktop とサーバーマシンであるTableau Server システムDSN を設定すると、接続しているSpark データソースをリフレッシュすることができます。Tableau Server のインターフェースで[データ]->[使用中のデータソース]->更新(Refresh)をクリックします。

Tableau Desktop からオンデマンドで更新データを取得。 (Salesforce is shown.)

Tableau Server でSpark データに連携する完成したワークブックをパブリッシュする

特定の完成したワークブックを組織内で共有する場合、Tableau Desktop でワークブックを作成し、直接Tableau Server にパブリッシュすることができます。

  1. 上記の1-5 の手順で、Spark に接続し、データを取得します。 テーブルデータの取得 (Salesforce is shown.)
  2. [サーバー]-> [サインイン]をクリックして、サーバーの接続を設定します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  3. 選択されたデータに対しビジュアライズするディメンションおよびメジャー選択し、チャートやブラフでビジュアライズを行います。
  4. ワークブックが完成したら、[サーバー]-> [ワークブックのパブリッシュ]でTableau Server ににパブリッシュします。
  5. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで組織内のユーザーTableau Server のパブリッシュされたワークブックを参照することができるようになります。

Tableau Server ワークブックをパブリッシュ。 (Salesforce is shown.)

Spark からTableau Server へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。