各製品の資料を入手。
詳細はこちら →JDBC データソースでGoogle Data Catalog との間にInformatica マッピングを作成
標準のJDBC 接続プロセスを使用して、Informatica でGoogle Data Catalog のデータオブジェクトを作成します。JAR をコピーし、接続してください。
最終更新日:2022-01-06
この記事で実現できるGoogle Data Catalog 連携のシナリオ
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for GoogleDataCatalog を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でGoogle Data Catalog を転送および参照する方法を示します。
ドライバーをデプロイ
ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.
Developer ツールでGoogle Data Catalog を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。
- Informatica-installation-directory\client\externaljdbcjars
- Informatica-installation-directory\externaljdbcjars
JDBC 接続の作成
以下のステップに従って、Informatica Developer に接続します。
- [Connection Explorer]ペインで[domain]を右クリックし、[Create a Connection]をクリックします。
- 表示される[New Database Connection]ウィザードで、接続の名前とId を入力し、[Type]メニューで[JDBC]を選択します。
- [JDBC Driver Class Name]のプロパティで次のコードを入力します。
cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver
- [Connection String]プロパティでは、Google Data Catalog の接続プロパティを使用してJDBC URLを入力します。
Google Data Catalog 接続プロパティの取得・設定方法
認証プロパティを追加する前に、次の接続プロパティを設定してください。
- OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
- ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。
Google Data Catalog への認証
CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。
OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。
ビルトイン接続文字列デザイナ
JDBC URL の構成については、Google Data Catalog JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.googledatacatalog.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
jdbc:googledatacatalog:ProjectId=YourProjectId;InitiateOAuth=GETANDREFRESH
Google Data Catalog テーブルを参照
ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のGoogle Data Catalog エンティティにアクセスできるようになります。以下のステップに従ってGoogle Data Catalog に接続し、Google Data Catalog テーブルを参照します。
- リポジトリに接続します。
- [Connection Explorer]で、[connection]を右クリックし、[Connect]をクリックします。
- [Show Default Schema Only]オプションをクリアします。
以下より、[Data Viewer]でGoogle Data Catalog テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。

Google Data Catalog のデータオブジェクトの作成
以下のステップに従って、プロジェクトにGoogle Data Catalog テーブルを追加します。
- Google Data Catalog でテーブルを選択し、右クリックして[Add to Project]をクリックします。
- 表示されるダイアログでリソースごとにデータオブジェクトを作成するオプションを選択します。
- [Select Location]ダイアログで、プロジェクトを選択します。
マッピングの作成
以下のステップに従って、マッピングにGoogle Data Catalog ソースを追加します。
- [Object Explorer]でプロジェクトを右クリックし、[New]->[Mapping]と進みます。
- Google Data Catalog 接続のノードを展開し、テーブルのデータオブジェクトをエディターにドラッグします。.
- 表示されるダイアログで、[Read]オプションを選択します。
以下のステップに従って、Google Data Catalog カラムをフラットファイルにマッピングします。
- [Object Explorer]でプロジェクトを右クリックし、[New]->[Data Object]と進みます。
- [Flat File Data Object]->[Create as Empty]->[Fixed Width]と選択していきます。
- Google Data Catalog オブジェクトのプロパティで必要な行を選択して右クリックし、[copy]をクリックします。行をフラットファイルのプロパティにペーストします。
- フラットファイルのデータオブジェクトをマッピングにドラッグします。
- 表示されるダイアログで、[Write]オプションを選択します。
- クリックしてドラッグすることで、列を接続します。
Google Data Catalog を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。