製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

Visio のシェイプとSpark データを連携

Visio マスターシェイプでの変更を自動的にSpark データに更新します。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-09-23
spark ロゴ

CData

odbc ロゴ画像
Visio ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData ODBC Driver for SparkSQL を使ってVisio ダイアグラムへのデータ入力プロセスを自動化し、ダイアグラムを最新の状態に保つことができます。ドライバーはSpark データをODBC データソースとして出力し、Microsoft Office のようなODBC サポートを組み込んだアプリケーションからのアクセスを実現します。この記事では、Spark データをリンクしたVisio プロジェクトでブレーンストーミングを始めるためのシンプルなダイアグラムを作成する方法を紹介します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにSpark データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Visio 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとSpark への接続設定

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

接続プロパティが未設定の場合は、はじめにODBC DSN(データソース名)に設定します。これはドライバーのインストールの最後の手順にあたります。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および設定できます。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

Spark データをダイアグラムに連携

以下の手順に従い、データ選択ウィザードを使ってダイアグラムにデータをインポートします。

  1. Visio を開き、「ファイル」->「新規」をクリックします。「ブレーンストーミング図」テンプレート(Visio Plan 1 が必要です)を開きます。
  2. 「データ」タブで、「図形にデータをリンク」をクリックします。
  3. ODBC オプションを選択し、次に「ODBC DSN」を選択します。
  4. SparkSQL のDSN を選択し、インポートしたいテーブルを選択してウィザードを終了します。この記事では、Customers を例にしています。
ブレーンストーミングステンシルをベースにダイアグラムにインポートしたテーブル(Salesforce の場合)

Spark エンティティを図形にリンク

以下の手順で、Spark エンティティを図形にリンクする方法の1つである、データから図形を作成する方法を示す簡単なダイアグラムを作成します。

  1. 「ブレーンストーミング図形」をクリックして、メイントピックを図面ページへドラッグします。メイントピックのテキストとしてCustomers を入力します。
  2. 「トピック」をクリックします。
  3. 「外部データ」ウィンドウで行を選択し、図面ページ上にドラッグします。
  4. 「トピック」図形を右クリックし、「データ」->「データグラフィックの編集」をクリックします。
  5. 「新しいアイテム」をクリックします。
  6. 「データフィールド」メニューで、カラムを選択します。「表示形式」メニューで、表示方法を選択します。 カラムのデータグラフィック
  7. 他のいくつかのSpark エンティティを図面ページにドラッグし、メイントピックであるCustomers に戻る関連線を追加します。新しいトピックは同じ構成です。データバーに表示される数値カラムは、他のCustomers エンティティとは対照的にハイライトされます。 外部データを使ったブレーンストーミング(Salesforce の場合)

「データ」タブから、外部のSpark データと図形を同期してダイアグラムを更新することができます。

Spark からVisio へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。