各製品の資料を入手。
詳細はこちら →StiLL からCData ODBC Driver を使ってSpark につないでみた
CData ODBC Driver を使って、Spark へのデータ連携をStiLL から行うことができます。StiLL の「データベース取得」機能を使って、Spark のデータをStiLL で使ってみましょう。
最終更新日:2022-11-20
この記事で実現できるSpark 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している兵藤です。
Excel をUIにした業務アプリ開発ツール「StiLL Standard」には、ODBC でデータベースからのデータを使う機能が備わっているので、これを使ってSpark のデータ連携を行うことが可能です。 通常、Spark などのSaaS として提供されるアプリケーションにはWeb API でアクセスしますが、CData ODBC Driver によって、RDB にアクセスするのと同感覚で、Spark のデータを扱うことができます。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにSpark のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.StiLL 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとSpark への接続設定
まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
CData ODBC Driver for SparkSQL のDSN をStiLL で選択します。
-
未指定の場合は、初めにODBC DSN (data source name) で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
SparkSQL への接続
SparkSQL への接続を確立するには以下を指定します。
- Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server:Databricks クラスターのサーバーのホスト名に設定。
- Port:443
- TransportMode:HTTP
- HTTPPath:Databricks クラスターのHTTP パスに設定。
- UseSSL:True
- AuthScheme:PLAIN
- User:'token' に設定。
- Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。
DSN はビルトインのMicrosoft ODBC データソースアドミニストレーターで設定できます。これはドライバーのインストールの最後の手順です。 Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定する方法は、ヘルプドキュメントの「はじめに」をご参照ください。
-
StiLL をインストールしたExcel を開き、StiLL リボンの「StiLL ボタンテンプレート」からボタンを選択します。
-
ボタンをダブルクリックして、「DBデータ取得」をクリックします。
-
データソース選択画面で、「コンピューターデータソース」から2で設定したCData Spark Source を選択します。
Spark のデータのStiLL アプリケーションへの取得
StiLL ボタンのBtQuery ウィザードが開くので、Spark からデータを指定して、StiLL アプリケーションに取り込みます。
-
データを取得したいテーブル名を選択します。テーブルはCData Driver がSparkのエンドポイントをモデル化してテーブルにしています。
-
テーブル名を選択後、出力項目の選択や、表示セル位置の指定を行います。
-
設定後、「OK」を押すだけで、StiLL アプリケーションからSalesforce データが指定された表示位置にロードされます。
Spark からStiLL へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。