- ODBC Drivers
- Java JDBC Drivers
- ADO.NET Providers
- SQL SSIS Components
- BizTalk Adapters
- Excel Add-Ins
- Power BI Connectors
- Delphi & C++Builder
- Data Sync
- API Server
MySQL へのHive データの自動反復レプリケーション
MySQL にCData Sync を使って、Hive データを自動、反復、フレキシブルにレプリケーション。常時起動のアプリケーションは、自動フェイルオーバー機能およびリアルタイムなデータアクセスを必要とします。 CData Sync は、MySQL にHive data を反復同期します。CData Sync で、アーカイブ、レポーティング、アナリティクス、機械学習、AI などで使えるよう、企業内の多様なデータを一か所に統合して管理することが可能になります。
MySQL をレプリケーションの同期先に設定
CData Sync を使って、MySQL にHive data をレプリケーションします。レプリケーションの同期先を追加するには、[接続]タブを開きます。
- [同期先]タブをクリックします。
- MySQL を同期先として選択します。
- 必要な接続プロパティを入力します。MySQL との接続には、以下のプロパティが必要です:
- Server: 接続先のIP アドレスもしくはドメイン名。
- Port: サーバーのポート。
- User: データベースのread/write アクセスが可能なusername。
- Password: データベースのread/write アクセスが可能なユーザーのpassword。
- Database: データベース名。
- [接続のテスト]をクリックして、正しく接続できているかをテストします
- [変更を保存]をクリックします。
Hive 接続の設定
データソース側にHive を設定します。[接続]タブをクリックします。
- [接続の追加]セクションで[データソース]タブを選択します。
- Hive アイコンをデータソースとして選択します。プリインストールされたソースにHive がない場合には、追加データソースとしてダウンロードします。
- 接続プロパティに入力をします。
Set the Server, Port, TransportMode, and AuthScheme connection properties to connect to Hive. - [接続のテスト]をクリックして、正しく接続できているかをテストします。
- [変更を保存]をクリックします。
レプリケーションを実行するクエリの設定
Data Sync はレプリケーションをコントロールするSQL クエリを簡単なGUI 操作で設定できます。 レプリケーションジョブ設定には、[ジョブ]タブに進み、[ジョブを追加]ボタンをクリックします。 次にデータソースおよび同期先をそれぞれドロップダウンから選択します。

テーブル全体をレプリケーションする
テーブル全体をレプリケーションするには、[テーブル]セクションで[テーブルを追加]をクリックします。表示されたテーブルリストからレプリケーションするテーブルをチェックします。

テーブルをカスタマイズしてレプリケーションする
レプリケーションはテーブル全体ではなく、カスタマイズが可能です。[変更]機能を使えば、レプリケーションするカラムの指定、同期先でのカラム名を変更しての保存、ソースデータの各種加工が可能です。レプリケーションのカスタマイズには、ジョブの[変更]ボタンをクリックしてカスタマイズウィンドウを開いて操作を行います。

レプリケーションのスケジュール起動設定
[スケジュール]セクションでは、レプリケーションジョブの自動起動スケジュール設定が可能です。反復同期間隔は、15分おきから毎月1回までの間で設定が可能です。

レプリケーションジョブを設定したら、[変更を保存]ボタンを押して保存します。Hive data のMySQL へのレプリケーションジョブは一つではなく複数を作成することが可能です。