SAS JMP でのCData ODBC Driver for Databricks の使用

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks ODBC Driver

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデーたベースのように標準ODBC インターフェースでRead、Write。



CData ODBC Driver を使用して、Databricks をSAS JMP で使用可能な統計分析ツールに統合できます。この記事では、Graph Builder とQuery Builder でDatabricks を表示する方法について説明します。

また、CData ODBC Driver for Databricks を使用して、ライブデータをSAS JMP との統計分析に統合できます。ドライバーは、クエリを直接Databricks API にプロキシし、分析がデータへの変更を反映していることを確認します。CData ODBC Driver は、レポートをデザインする際バックグラウンドでJMP によって使用される、標準SQL をサポートします。

Databricks API は、双方向アクセスをサポートしています。この記事では、Databricks をレポートにアクセスし、データのビジュアライゼーションを作成する方法を説明します。また、SQL を使用してJMP Query Builder からDatabricks データをクエリおよび操作する方法も説明します。

ODBC Data Source としてDatabricks データにアクセス

未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

To connect to a Databricks cluster, set the properties as described below.

Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

  • Server: Set to the Server Hostname of your Databricks cluster.
  • HTTPPath: Set to the HTTP Path of your Databricks cluster.
  • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。

Query Builder でDatabricks データをインポート

Databricks DSN を作成したら、SQL を使用してDatabricks API の機能を呼び出すことができます。以下のステップに従ってQuery Builder でサポートされているクエリを実行します。

  1. SAS JMP で[File]->[Database]->[Query Builder]とクリックします。[Select Database Connection]ダイアログが表示されます。
  2. [New Connection]をクリックします。
  3. [Machine Data Source]タブで[DSN]を選択します。次のステップでは、[Select Tables for Query]ダイアログが表示されます。
  4. [Available Tables]セクションでテーブルを選択し、[Primary]をクリックします。
  5. [Available Columns]を[Included Columns]タブにドラッグすると、基になるSQL クエリが更新されます。
  6. データを表示するには[Run Query]をクリックします。
  7. 結果を現在のデータで更新するには、[Update from Database]を右クリックし、[Run Script]をクリックします。

Databricks データの操作

以下のようなJSL スクリプトから、データ操作クエリを実行できます。スクリプトを実行するには、ツールバーの[New Script]をクリックします。接続するには、DSN を指定します。これで、標準SQL 構文を使用できるようになります。

Open Database( "DSN=CData Databricks Source;", "INSERT INTO Customers (Country) VALUES ('US');");

Databricks データをビジュアライズ

インポート後、Graph Builder を使用して視覚的にグラフを作成できます。Graph Builder を開くには、ツールバーの[Graph Builder]ボタンをクリックします。

  1. ディメンションカラムをx 軸にドラッグします。例:City
  2. メジャーカラムをy 軸にドラッグします。例:CompanyName
  3. チャートタイプを選択します。例:棒グラフ