製品をチェック

製品についての詳細情報や無償トライアルをご案内します:

CData Sync

データ連携でお困りですか?

お問い合わせ

Oracle データベースへのDatabricks データの反復同期を設定


データパイプラインツールのCData Sync を使って、Databricks データのCDC を使ったOracle への同期をノーコードで設定。


古川えりか
コンテンツスペシャリスト

databricks ロゴ画像

CData Sync

sync ロゴ画像
Oracle Database ロゴ画像

常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。 CData Sync は、Oracle インスタンスに直近のDatabricksを反復同期します。Oracle はオンプレミスのみならずクラウドにホスティングされたOracle にもレプリケーションが可能です。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります。

Oracle をレプリケーションの同期先に設定

CData Sync を使って、Oracle にDatabricks data をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。

  1. [同期先]タブをクリックします。
  2. Oracle を同期先として選択します。 Oracle を同期先として設定。
  3. 必要な接続プロパティを入力します。Oracle に接続するためには、Oracle Database Client が必要です。Instant Client では不可です。Oracle Database Client のダウンロード時には、アプリケーションのbit と一致するものをダウンロードします。インストール時にはRuntime もしくはAdministrator インストールタイプを選択します。

    Oracle データベースへの接続に次を設定します:

    • Server: Oracle データベースのホスト名、もしくはサーバーのIP あどれす。
    • Port: Oracle データベースをホストしているサーバーに接続するポート名。
    • User: Oracle データベースに認証するuser ID。
    • Password: Oracle データベースに認証するpassword。
    • SID: Oracle データベースのサービス名。

  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。 同期先接続のテスト
  5. [変更を保存]をクリックします。

Databricks 接続の設定

データソース側にDatabricks を設定します。[接続]タブをクリックします。

  1. [接続の追加]セクションで[データソース]タブを選択します。
  2. Databricks アイコンをデータソースとして選択します。プリインストールされたソースにDatabricks がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。

    Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    • Database:Databricks データベース名に設定。
    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • Token:個人用アクセストークンに設定(この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます)。
    データソースセクションの設定(Salesforce 画面を例示)。
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

レプリケーションを実行するクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

レプリケーションジョブのソースおよび同期先を選択。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

レプリケーションするテーブルの選択(画像はSalesforce の例)。

テーブルをカスタマイズしてレプリケーションする

レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。

レプリケーションのカスタマイズ設定。

レプリケーションのスケジュール起動設定

[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

スケジュール起動設定。

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Databricks data のOracle へのレプリケーションジョブは一つではなく複数を作成することが可能です。