製品をチェック

製品の詳細・30日間の無償トライアルはこちら

CData Sync

複数Google Data Catalog アカウントをレプリケーション

複数のGoogle Data Catalog アカウントを、1つあるいは多数のデータベースにレプリケーション。

宮本航太
プロダクトスペシャリスト

最終更新日:2022-06-05

こんにちは!プロダクトスペシャリストの宮本です。

CData Sync for GoogleDataCatalog は、データベースにサンドボックスや製品インスタンスをレプリケートするなどの、レプリケーションの多様なシナリオに対する解決策を提供するスタンドアロンアプリケーションです。Sync for Windows およびSync for Java はどちらもコマンドラインインターフェース(CLI)を含んでおり、複数のGoogle Data Catalog 接続を簡単に管理できます。この記事では、CLI を使って複数のGoogle Data Catalog アカウントをレプリケートする方法について説明します。

Google Data Catalog 接続の構成

接続およびE メール通知設定をXML 設定ファイルに保存できます。複数のGoogle Data Catalog アカウントをレプリケートするには、複数の設定ファイルを使います。以下にGoogle Data Catalog をSQLite にレプリケートする設定例を示します。

Windows

<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>System.Data.SQLite</DatabaseProvider> <ConnectionString>ProjectId=YourProjectId;</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> <TaskSchedulerStartTime>09:51</TaskSchedulerStartTime> <TaskSchedulerInterval>Never</TaskSchedulerInterval> </CDataSync>

Java

<?xml version="1.0" encoding="UTF-8" ?> <CDataSync> <DatabaseType>SQLite</DatabaseType> <DatabaseProvider>org.sqlite.JDBC</DatabaseProvider> <ConnectionString>ProjectId=YourProjectId;</ConnectionString> <ReplicateAll>False</ReplicateAll> <NotificationUserName></NotificationUserName> <DatabaseConnectionString>Data Source=C:\my.db</DatabaseConnectionString> </CDataSync>

Google Data Catalog 接続プロパティの取得・設定方法

認証プロパティを追加する前に、次の接続プロパティを設定してください。

  • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
  • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

Google Data Catalog への認証

CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

各Google Data Catalog インスタンスにクエリを設定

Sync を使うと標準SQL でレプリケーションを制御できます。REPLICATE ステートメントはハイレベルなコマンドで、データベースにテーブルをキャッシュして維持します。Google Data Catalog API がサポートするあらゆるSELECT クエリを定義できます。下記のステートメントは、Google Data Catalog データ のテーブルをキャッシュしてインクリメンタルに更新します。

REPLICATE Schemas;

特定のデータベースを更新するために使用するレプリケーションクエリを含むファイルを指定することができます。レプリケーションステートメントはセミコロンで区切ります。次のオプションは、複数のGoogle Data Catalog アカウントを同じデータベースにレプリケートする場合に便利です。

REPLICATE SELECT ステートメントでは、異なるテーブルのプレフィックスを使用できます。

REPLICATE PROD_Schemas SELECT * FROM Schemas

異なるスキーマを使用することもできます。

REPLICATE PROD.Schemas SELECT * FROM Schemas

Sync の実行

接続文字列およびレプリケーションクエリの設定が完了したら、次のコマンドラインオプションを使ってSync を実行できます。

Windows

GoogleDataCatalogSync.exe -g MyProductionGoogleDataCatalogConfig.xml -f MyProductionGoogleDataCatalogSync.sql

Java

java -Xbootclasspath/p:c:\sqlitejdbc.jar -jar GoogleDataCatalogSync.jar -g MyProductionGoogleDataCatalogConfig.xml -f MyProductionGoogleDataCatalogSync.sql

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。