Amazon Redshift へのPayPal データの自動反復レプリケーション

Amazon Redshift にCData Sync を使って、PayPal データを自動、反復、フレキシブルにレプリケーション。

常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。 CData Sync は、Amazon Redshift インスタンスに直近のPayPal data を反復同期します。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります。

Amazon Redshift をレプリケーションの同期先に設定

CData Sync を使って、Amazon Redshift にPayPal data をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。

  1. [同期先]タブをクリックします。
  2. Amazon Redshift を同期先として選択します。
  3. 要な接続プロパティを入力します。Amazon Redshift との接続には、以下のプロパティが必要です: :
    • Server: 接続するDatabase をホストしているクラスタのホスト名もしくはIP アドレス。
    • Port: クラスタのポート。
    • Database: データベース名。認証ユーザーのデフォルトのデータベースを使う場合には、空欄でOK。
    • User: Server に認証するユーザー。.
    • Password: Server に認証するユーザーのpassword。

    AWS Management Console でこれらの接続プロパティの値を取得できます:

    1. Amazon Redshift console を開きます。
    2. Clusters ページでクラスタ名をクリックします。
    3. Configuration タブで、Cluster Database Properties セクションでプロパティを取得します。接続プロパティはODBC URL でセットするプロパティと同様です。

  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

PayPal 接続の設定

データソース側にPayPal を設定します。[接続]タブをクリックします。

  1. [接続の追加]セクションで[データソース]タブを選択します。
  2. PayPal アイコンをデータソースとして選択します。プリインストールされたソースにPayPal がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    The provider surfaces tables from two PayPal APIs. The APIs use different authentication methods.

    • The REST API uses the OAuth standard. To authenticate to the REST API, you will need to set the OAuthClientId, OAuthClientSecret, and CallbackURL properties.
    • The Classic API requires Signature API credentials. To authenticate to the Classic API, you will need to obtain an API username, password, and signature.

    See the "Getting Started" chapter of the help documentation for a guide to obtaining the necessary API credentials.

    To select the API you want to work with, you can set the Schema property to REST or SOAP. By default the SOAP schema will be used.

    For testing purposes you can set UseSandbox to true and use sandbox credentials.

  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

レプリケーションを実行するクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

テーブルをカスタマイズしてレプリケーションする

レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。

レプリケーションのスケジュール起動設定

[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。PayPal data のAmazon Redshift へのレプリケーションジョブは一つではなく複数を作成することが可能です。

 
 
ダウンロード