常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。CData Sync は、Apache Cassandra インスタンスに直近のGoogle Cloud Storage を反復同期します。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります
Cassandra をレプリケーションの同期先に設定
CData Sync を使って、Apache Cassandra にGoogle Cloud Storage をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。
- [同期先]タブをクリックします。
- Apache Cassandra を同期先として選択します。
必要な接続プロパティを入力します。CData Sync は、ログインクレデンシャルを使ったベーシック認証および、DataStax Enterprise(DSE)Cassandra の認証をサポートしています。以下が、認証メソッドで要求される接続プロパティです。
AuthScheme を対応するシステムの認証に設定します。cassandra.yaml ファイルの認証方法にauthenticator プロパティを設定します。ファイルは通常/etc/dse/cassandra か、DSN Cassandra では、DSE Unified Authonticator にあります。
Basic Authentication
ベーシック認証は、Cassandra のビルトインのデフォルトPasswordAuthenticator でサポートされています。
- AuthScheme プロパティを 'BASIC' に設定し、Userおよび Password プロパティを設定します。
- cassandra.yaml ファイルでauthenticator プロパティを 'PasswordAuthenticator' に設定します。
Kerberos 認証
Kerberos 認証は、DataStax Enterprise Unified Authentication でサポートされています。
- AuthScheme プロパティを 'KERBEROS' に設定し、Userおよび Password プロパティを設定します。
- SKerberosKDC、KerberosRealm、KerberosSPN プロパティを設定します。
- cassandra.yaml ファイルでauthenticator プロパティを "com.datastax.bdp.cassandra.auth.DseAuthenticator" に設定します。
- dse.yaml ファイルのauthentication_options セクションを変更し、keytab、service_principle、http_principle、qop プロパティを'kerberos' に設定します。
- dse.yaml ファイルの セクションを変更し、keytab、service_principle、http_principle、qop プロパティを設定します。
LDAP 認証
LDAP 認証は、DataStax Enterprise Unified Authentication でサポートされています。
- AuthScheme プロパティを 'LDAP' に設定し、Userおよび Password プロパティを設定します。
- cassandra.yaml ファイルでauthenticator プロパティを "com.datastax.bdp.cassandra.auth.DseAuthenticator" に設定します。
- dse.yaml ファイルのauthentication_options セクションを変更し、keytab、service_principle、http_principle、qop プロパティを'ldap' に設定します。
- dse.yaml ファイルのldap_options セクションを変更し、server_host、server_port、search_dn、search_password、user_search_base、user_search_filter プロパティを設定します。
PKI の使用
CData Sync でクライアント証明書をSSLClientCert、SSLClientCertType、SSLClientCertSubject、SSLClientCertPassword で指定できます。
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
Google Cloud Storage 接続の設定
データソース側にGoogle Cloud Storage を設定します。[接続]タブをクリックします。
- [同期先]タブをクリックします。
- Google Cloud Storage アイコンをデータソースとして選択します。プリインストールされたソースにGoogle Cloud Storage がない場合には、追加データソースとしてダウンロードします。
- 接続プロパティに入力をします。
ユーザーアカウントでの認証
ユーザー資格情報の接続プロパティを設定することなく接続できます。InitiateOAuth をGETANDREFRESH に設定したら、接続の準備が完了です。
接続すると、Google Cloud Storage OAuth エンドポイントがデフォルトブラウザで開きます。ログインして権限を付与すると、OAuth プロセスが完了します。
サービスアカウントでの認証
サービスアカウントには、ブラウザでユーザー認証を行わないサイレント認証があります。サービスアカウントを使用して、企業全体のアクセススコープを委任することもできます。
このフローでは、OAuth アプリケーションを作成する必要があります。詳しくは、ヘルプドキュメントを参照してください。以下の接続プロパティを設定したら、接続の準備が完了です:
- InitiateOAuth: GETANDREFRESH に設定。
- OAuthJWTCertType: PFXFILE に設定。
- OAuthJWTCert: 生成した.p12 ファイルへのパスに設定。
- OAuthJWTCertPassword: .p12 ファイルのパスワードに設定。
- OAuthJWTCertSubject: 証明書ストアの最初の証明書が選ばれるように"*" に設定。
- OAuthJWTIssuer: 「サービスアカウント」セクションで「サービスアカウントの管理」をクリックし、このフィールドをサービスアカウントID フィールドに表示されているE メールアドレスに設定。
- OAuthJWTSubject: サブジェクトタイプが"enterprise" に設定されている場合はエンタープライズID に設定し、"user" に設定されている場合はアプリユーザーID に設定。
- ProjectId: 接続するプロジェクトのID に設定。
これで、サービスアカウントのOAuth フローが完了します。
- [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
レプリケーションを実行するクエリの設定
CData Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。
テーブル全体をレプリケーションする
テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。
テーブルをカスタマイズしてレプリケーションする
レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。
レプリケーションのスケジュール起動設定
[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。
レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存しますGoogle Cloud Storage のApache Cassandra へのレプリケーションジョブは一つではなく複数を作成することが可能です。