Claris FileMaker のESS 機能からSpark にデータ連携する方法

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Apache Spark ODBC Driver

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。



Claris FileMaker のESS 機能から CData ODBC Driver + SQL Gateway でSpark データにシームレスに連携。



この記事では、Claris FileMaker (以下、FileMaker)のESS(External SQL Source)機能からCData ODBC Driver、および、SQL Gateway を利用してSpark データにシームレスに連携する方法を紹介します。

FileMaker のESS(External SQL Source)機能は、FileMaker から外部データソースにライブ接続できる機能です。ただし、使用できるODBC driver は、FileMaker 側がサポートしているドライバーのみであり、CData ODBC Drivers のような任意のサードパーティドライバーを使用することができません。そこで、CData ODBC Driver をMySQL に仮想してアクセスできるようにするSQL Gateway

を使います。FileMaker のESS 側はデフォルトのMySQL ODBC Driver を使ってSQL Gateway 経由でSpark データにアクセスします。

尚、インポートだけの処理だと、SQL Gateway を使わなくてもサードパーティODBC のデータをインポートすることが可能です。ODBC でSpark データをFilemaker にインポート

※製品について詳しい情報をご希望の方は以下からお進みください。

ODBC Driver でSpark データソースに接続

まずはCData ODBC Driver for Spark をインストールします。

  1. 接続プロパティの指定で、データソース名(DSN)で定義された接続プロパティを指定します。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    一般的な接続文字列は次のとおりです:

    Server=127.0.0.1;

    DSN はビルトインのMicrosoft ODBC データソースアドミニストレーターで設定できます。これはドライバーのインストールの最後の手順です。 Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定する方法は、ヘルプドキュメントの「はじめに」をご参照ください。

    SQL Gateway でSpark ODBC のサービスを設定

    次にSQL Gateway で上の手順で作成したSpark ODBC DSN をMySQL サービスとして公開します。

    • CData ODBC Driver をインストールしたWindows マシンのプログラムメニューから「CData SQL Gateway」を起動します。
    • 起動するとCData SQL Gateway のコンソールが開きます。「サービス」タブを開き、「追加」ボタンをクリックします。「新規サービスの追加」ダイアログが表示されるので以下の項目をセットします。
      • サービス名:任意(アルファベットでスペースなどの特殊文字系は含めないのが望ましい、本例では「CData」)
      • 選択(TDS(SQLServer)、MySQL)ラジオボタン:「MySQL」を選択
      • データソース :CData ODBC Driver のシステムDSN 名を選択(本例では、CData Spark Sys)
      • ポート:同マシンにMySQL が既に起動している場合は、デフォルトの3306が既に利用されているので本例では「3307」を指定
    • 「OK」ボタンをクリックして「新規サービスの追加」ダイアログを閉じ、上記で設定したサービスが追加されたのを確認します。
    • 「ユーザー」タブを開き、「追加」ボタンをクリックします。「新規ユーザーの追加」ダイアログが表示されるので任意の名称で「ユーザー」および「パスワード」を設定します。本情報が、仮想MySQL へのログイン情報となりますので手元に控えておいてください。
    • 「サービス」タブに移動して上段メニューの「変更を保存」、その後に「開始」ボタンをクリックします。仮想MySQL インスタンスが起動するとサービス名左横のランプが緑になります。

    Claris Filemaker のESS からSpark に連携

    MySQL ODBC Driver のインストールと設定

    • MySQL ODBC 8.0 Unicode Driver のの64bit Windows版をダウンロードしてインストールします。
    • インストールが完了したら、Windows の検索から「odbc」と入力して「ODBCデータソース (64bit)」を起動します。
    • 「システムDSN」タブを開き、「追加」ボタンから「データソース の新規作成」にて「MySQL ODBC 8.0 Unicode Driver」を選択して「完了」ボタンをクリックします。
    • 「MySQL Connector/ODBC Data Source Configuration」が起動して以下の項目をセットします。
      • Data Souce Name : 任意の名称(本例では、「CData」)
      • TCP/IP Server : CData SQL Gateway の仮想MySQL が起動しているマシンのIP アドレス(同一マシンの場合は「localhost」)
      • Port : SQL Gatewayで設定したポート(本手順では「3307」を使用)
      • User : SQL Gatewayで設定したユーザー名
      • >Password : SQL Gateway で設定したユーザーのパスワード
      • Database : ドロップダウンリストからCData ODBC Driver のDSN 名称「CData Spark Sys」を選択
    • 「Test」ボタンをクリックして「Connection Successful」ダイアログが表示されることを確認してダイアログ含め「OK」ボタンで保存して「ODBC データソース アドミニストレーター(64ビッド)」ウィンドウまで閉じてください。

    FileMaker ESS 機能からSpark データに連携

    • FileMaker のデータベースの管理にて、「リレーションシップ」タブから「テーブル」を追加します。データソース として「ODBC データソース の追加」を選びます。
    • ODBC データソースを選択の画面で、MySQL ODBC Driver で設定したデータソース名(ドライバがMySQL ODBC 8.0 Unicode Driver のもの)を選択します。注意点としては、ここでCData ODBC Driver のデータソース 名(CData Spark Sys)を選択しないでください。
    • 「データソース の編集」画面で以下の項目をセットして「OK」ボタンをクリックします。
      • 名前:任意(本例では「CData」)
      • 認証(ユーザ名とパスワードを指定) :SQL Gateway で設定した仮想MySQLへのログイン ユーザ名、および、パスワード
      • カタログ名:CData ODBC Driver のDSN 名(CData Spark Sys)
    • 「テーブルを指定」ダイアログにてFileMaker のレイアウトで利用したデータソース 内のテーブルを選択します。
    • 「データベースの管理」に選択したテーブルが追加されたことを確認します。
    • 指定したテーブルをレイアウトにセットします。データソース 内のデータが表示されれば成功です。

    まとめと試用版

    CData ODBC Driver for Spark とSQL Gateway を使うことで、Filemaker でSpark データをシームレスに扱えるようになります。ぜひ、30日の無償評価版 をお試しください。