Ready to get started?

Learn more about the CData ODBC Driver for Apache Spark or download a free trial:

Download Now

Apache Spark Data をTableau でビジュアライズ

CData ODBC driver for Apache Spark data は、Tableau ダッシュボードへのApache Spark data 統合を可能にします。



CData ODBC Driver for Apache Spark は、Tableau でライブApache Spark data へのアクセスを可能にします。Apache Spark data のカラムをデータビジュアライゼーションにドラグ&ドロップすると、Tableau はクエリを作成しApache Spark に直接要求を出します。この記事ではApache Spark data をダッシュボードに統合します。

ダッシュボードに Apache Spark Data を追加

  1. 接続プロパティの指定がまだの場合は、DSN (データソース名)で行います。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。一般的な接続プロパティは以下のとおりです:

    • Server

    Microsoft ODBC データソースアドミニストレーターで必要なプロパティを設定する方法は、ヘルプドキュメントの「はじめに」をご参照ください。

  2. [Connect to Data]>[More Servers]>[Other Databases (ODBC)]をクリックします。CData Data Source Name (DSN) を選択します;CData driver は64ビットおよび32ビットアプリケーションの両方をサポートしています。

  3. [Database]メニューでCData を選択します。
  4. [Table]ボックスにテーブル名を入力、または[New Custom SQL]をクリックしてSQL クエリを入力します。
  5. [Data Source]ページで、テーブルをjoin エリアにドラッグします。
  6. [Connection]メニューで[Live]オプションをクリックします。コピーデータのTableau へのロードをスキップして、代わりにリアルデータを扱うためです。さらに、データビジュアライゼーションを作成するたびにTableau がApache Spark data に関連するクエリを実行するよう[Automatically Update]をクリックします。カラムはデータの種類に応じてDimensions およびMeasures としてリストされます。
  7. ワークシートのタブ上で、[Dimensions]ペインのカラムをダッシュボードにドロップします。dimensions を選択すると、Tableau はドライバーにクエリをビルドします。dimension の値は自動的にグループ化されます。クエリはdimensions およびmeasures を選択するたびに自動的に修正されます。

  8. [Measures]フィールドのカラムを、[Detail]および[Color]ボタンにドラッグします。measure を選択するとTableau はドライバーにコマンドを実行し、。

    例えば、Balance をCity で表すシンプルなチャートを作成するには、Tableau は次のクエリを実行します:

    SELECT City, Balance FROM Customers
  9. dimensions およびmeasures を使った別のチャートを作成してSQL クエリを視覚的にビルドできます:

 
 
ダウンロード