Redshift のデータをPowerShell でMySQL にレプリケーションする方法

PowerShell のシンプルなスクリプトで、Redshift のデータ をMySQL データベースにレプリケーション(複製)する方法を紹介します。

古川えりか
コンテンツスペシャリスト

最終更新日:2023-09-26

この記事で実現できるRedshift 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData Cmdlets for Redshift を使えば、PowerShell からRedshift のデータ データにリアルタイムで連携できます。データ同期などのタスクの連携にぴったりの製品です。 本記事では、PowerShell からCData Cmdlets for Redshift およびCData Cmdlets for MySQL を使って、同期スクリプトを作成して実行します。

まずは、PowerShell でRedshift への接続を行います。レプリケーションは4つのステップがあります。

Redshift への接続には次を設定します:

  • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
  • Port: クラスタのポート。
  • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
  • User: ユーザー名。
  • Password: ユーザーのパスワード。

Server およびPort の値はAWS の管理コンソールで取得可能です:

  1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
  2. Clusters ページで、クラスタ名をクリック。
  3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。

    Redshift のデータの取得

    1. モジュールのインストール:

      Install-Module RedshiftCmdlets
    2. Redshift への接続:

      $redshift = Connect-Redshift -User $User -Password $Password -Database $Database -Server $Server -Port $Port
    3. 取得ターゲットのリソースの取得:

      $data = Select-Redshift -Connection $redshift -Table "Orders"

      Invoke-Redshift cmdlet を使って、SQL-92 クエリを使用することもできます:

      $data = Invoke-Redshift -Connection $redshift -Query 'SELECT * FROM Orders WHERE ShipCountry = @ShipCountry' -Params @{'@ShipCountry'='USA'}
    4. 戻り値からカラム名のリストを保存します。

      $columns = ($data | Get-Member -MemberType NoteProperty | Select-Object -Property Name).Name

    Redshift のデータをMySQL データベースにレプリケーション

    カラム名を指定できるようにして、データをMySQL データベースにレプリケーションします。

    1. モジュールのインストール:

      Install-Module MySQLCmdlets
    2. MySQL DB に、MySQL Server 名、ユーザー、パスワード、レプリケーション先のデータベース名を指定して、接続します:

      $mysql = Connect-MySQL -User $User -Password $Password -Database $Database -Server $Server -Port $Port
    3. Redshift、保存された値、そしてAdd-MySQL Cmdlet を使って、MySQL にデータを1レコードずつ挿入します。この例では、MySQL 側のテーブルは、Redshift のリソース(Orders)と同じテーブル名を持っている必要があります。

      $data | % { $row = $_ $values = @() $columns | % { $col = $_ $values += $row.$($col) } Add-MySQL -Connection $mysql -Table "Orders" -Columns $columns -Values $values }

    次回以降のレプリケーションをシンプルに実現

    • 一度PowerShell でRedshift とMySQL に接続したら、次からは1行のコマンドでレプリケーションを実施できます:

      Select-Redshift -Connection $redshift -Table "Orders" | % { $row = $_ $values = @() $columns | % { $col = $_ $values += $row.$($col) } Add-MySQL -Connection $mysql -Table "Orders" -Columns $columns -Values $values }
    • 別のPowerShell モジュールで、Redshift を別のデータベースに複製する場合、Select-Redshift cmdlet のデータから、カラム、接続およびテーブルを除外しておきましょう。これらのデータはデータ移動のときだけ必要となるためです。

      $columns = ($data | Get-Member -MemberType NoteProperty | Select-Object -Property Name).Name | ? {$_ -NotIn @('Columns','Connection','Table')}

    おわりに

    これで、Redshift のデータをMySQL に複製できました。分析、BI などでRedshift のデータをMySQL から使うことができるようになります。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。