製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

SAS JMP でのCData ODBC Driver for Spark の使用

CData ODBC ドライバを使用して、Spark をSAS JMP で使用可能な統計分析ツールに統合できます。この記事では、Graph Builder とQuery Builder でSpark を表示する方法について説明します。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-06-10

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

また、CData ODBC Driver for SparkSQL を使用して、リアルタイムデータをSAS JMP の統計分析に統合できます。ドライバーは、クエリを直接Spark API にプロキシし、分析がデータへの変更を反映していることを確認します。CData ODBC Driver は、レポートをデザインする際バックグラウンドでJMP によって使用される、標準SQL をサポートします。

Spark API は、双方向アクセスをサポートしています。この記事では、Spark をレポートにアクセスし、データのビジュアライゼーションを作成する方法を説明します。また、SQL を使用してJMP Query Builder からSpark データをクエリおよび操作する方法も説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにSpark データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.SAP JMP 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとSpark への接続設定

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。

Query Builder でSpark データをインポート

Spark DSN を作成したら、SQL を使用してSpark API の機能を呼び出すことができます。以下のステップに従ってQuery Builder でサポートされているクエリを実行します。

  1. SAS JMP で[File]->[Database]->[Query Builder]とクリックします。[Select Database Connection]ダイアログが表示されます。
  2. [New Connection]をクリックします。
  3. [Machine Data Source]タブで[DSN]を選択します。次のステップでは、[Select Tables for Query]ダイアログが表示されます。
  4. [Available Tables]セクションでテーブルを選択し、[Primary]をクリックします。
  5. [Available Columns]を[Included Columns]タブにドラッグすると、基になるSQL クエリが更新されます。 The generated query in the Query Builder.(Salesforce is shown.)
  6. データを表示するには[Run Query]をクリックします。 The results of a query in the Query Builder.(Salesforce is shown.)
  7. 結果を現在のデータで更新するには、[Update from Database]を右クリックし、[Run Script]をクリックします。

Spark データの操作

以下のようなJSL スクリプトから、データ操作クエリを実行できます。スクリプトを実行するには、ツールバーの[New Script]をクリックします。接続するには、DSN を指定します。これで、標準SQL 構文を使用できるようになります。

Open Database( "DSN=CData SparkSQL Source;", "INSERT INTO Customers (Country) VALUES ('US');");

Spark データをビジュアライズ

インポート後、Graph Builder を使用して視覚的にグラフを作成できます。Graph Builder を開くには、ツールバーの[Graph Builder]ボタンをクリックします。

  1. ディメンションカラムをx 軸にドラッグします。例:City
  2. メジャーカラムをy 軸にドラッグします。例:Balance
  3. チャートタイプを選択します。例:棒グラフ Configuration of a basic chart.(Salesforce is shown.)

Spark からSAP JMP へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。