Google Cloud SQL へのQuandl データの自動反復レプリケーション

Google Cloud SQL にCData Sync を使って、Quandl データを自動、反復、フレキシブルにレプリケーション。

常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。 CData Sync は、Google Cloud SQL インスタンスに直近のQuandl data を反復同期します。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります。

Google Cloud SQL をレプリケーションの同期先に設定

CData Sync を使って、Google Cloud SQL にQuandl data をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。

  1. [同期先]タブをクリックします。
  2. Google Cloud SQL を同期先として選択します。MySQL かPostgreSQL かを選択します。
  3. 必要な接続プロパティを入力します。Google Cloud SQL との接続には、以下のプロパティが必要です:
    • IP Address: Google Cloud SQL データベースにアサインされたIP address。
    • User: Google Cloud SQL データベースに認証するためのusername。
    • Password: Google Cloud SQL データベースに認証するためのpassword。
    • Database: Google Cloud SQL データベースの名前。
  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

Quandl 接続の設定

データソース側にQuandl を設定します。[接続]タブをクリックします。

  1. [接続の追加]セクションで[データソース]タブを選択します。
  2. Quandl アイコンをデータソースとして選択します。プリインストールされたソースにQuandl がない場合には、追加データソースとしてダウンロードします。
  3. 接続プロパティに入力をします。

    Quandl uses an API key for authentication. See the help documentation for a guide to obtaining the APIKey property.

    Additionally, set the DatabaseCode connection property to the code identifying the Database whose Datasets you want to query with SQL. You can search the available Databases by querying the Databases view.

  4. [接続のテスト]をクリックして、正しく接続できているかをテストします。
  5. [変更を保存]をクリックします。

レプリケーションを実行するクエリの設定

Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

テーブル全体をレプリケーションする

テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

テーブルをカスタマイズしてレプリケーションする

レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。

レプリケーションのスケジュール起動設定

[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Quandl data のGoogle Cloud SQL へのレプリケーションジョブは一つではなく複数を作成することが可能です。

 
 
ダウンロード