製品をチェック

製品についての詳細情報や無償トライアルをご案内します:

CData Sync

データ連携でお困りですか?

お問い合わせ

Azure Data Lake への SAS Data Sets データの自動反復レプリケーション


Azure Data Lake にCData Sync を使ってSAS Data Sets データを自動、反復、フレキシブルにレプリケーション。


sasdatasets ロゴ画像
sync ロゴ画像

CData Sync

Azure Data Lake ロゴ画像

常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。CData Sync は、Azure Data Lake に インスタンスに直近のSAS Data Sets を反復同期します。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります。

Azure Data Lake をレプリケーションの同期先に設定

CData Sync を使って、Azure Data Lake にSAS Data Sets をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。

  1. [同期先]タブをクリックします。
  2. Azure Data Lake を同期先として選択します。 Configure a Destination connection to Azure Data Lake.
  3. 必要な接続プロパティを入力します。Azure Data Lake Storage との接続には、以下のプロパティが必要です:

    Azure Data Lake Storage Gen1

    • Generation: 1 に設定。
    • Account: Azure Data Lake Store アカウント名。
    • Path: レプリケーションファイルの保存先のパス(デフォルトはルートディレクトリ)。
    • TenantId: tenant ID。
    • OAuthClientId: Azure Directory web application のApplication ID(詳細はSync のヘルプ参照)。
    • OAuthClientSecret: Azure Directory web application に認可されたキー(詳細はSync のヘルプ参照)。

    Azure Data Lake Storage Gen2

    • Generation: 2に設定。.
    • Access Key: 認証で使用するアクセスキー(詳細はSync のヘルプ参照)。
    • Account: Azure Data Lake Store アカウント名。
    • FileSystem: アカウントで使われているファイルシステム名。
    • Path: レプリケーションファイルの保存先のパス(デフォルトはルートディレクトリ)。
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。 Configure a Destination connection (Generation 1 is shown).
  5. [変更を保存]をクリックします。

SAS Data Sets 接続の設定

データソース側にSAS Data Sets を設定します。[接続]タブをクリックします。

  1. [接続の追加]セクションで[データソース]タブを選択します。
  2. SAS Data Sets アイコンをデータソースとして選択します。プリインストールされたソースにSAS Data Sets がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    SAS DataSets ファイルに接続するには、次の接続プロパティを設定します。

    • URI: .sas7bdat リソースを含むフォルダに設定。現時点では、ローカルファイルのみをサポートしています。
    Configure a Source connection (Salesforce is shown).
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

レプリケーションを実行するクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

Select Source and Destination connections for the replication.

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

Choose entire tables to replicate (Salesforce is shown).

テーブルをカスタマイズしてレプリケーションする

レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。

Configure a replication Transform.

レプリケーションのスケジュール起動設定

[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

Schedule your job to run automatically.

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。SAS Data Sets のAzure Data Lake へのレプリケーションジョブは一つではなく複数を作成することが可能です。