Mule アプリケーションからGoogle Data Catalog のデータにアクセス:CData JDBC Driver

CData JDBC ドライバとHTTP、SQL を組み合わせれば、Google Data Catalog のデータのJSON エンドポイントに接続できるMule アプリケーションを簡単に作成できます。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-07-28

この記事で実現できるGoogle Data Catalog 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData JDBC Driver for GoogleDataCatalog はGoogle Data Catalog のデータをMule アプリケーションと連携することで、読みといった機能をおなじみのSQL クエリを使って実現します。JDBC ドライバーを使えば、Google Data Catalog のデータをバックアップ、変換、レポート作成、分析するMule アプリケーションをユーザーは簡単に作成できます。

本記事では、Mule プロジェクト内でCData JDBC Driver for GoogleDataCatalog を使用して、Google Data Catalog のデータのWeb インターフェースを作成する方法を紹介します。作成したアプリケーションを使えば、HTTP 経由でGoogle Data Catalog のデータをリクエストして、JSON 形式で結果を取得できます。まったく同様の手順で、すべてのCData JDBC ドライバで250 を超えるデータソースのWeb インターフェースを作成できます。手順は以下のとおりです。

  1. Anypoint Studio で新しいMule プロジェクトを作る。
  2. Message Flow にHTTP コネクタを追加する。
  3. HTTP コネクタのアドレスを設定する。 HTTP コネクタを追加・設定
  4. HTTP コネクタの追加後、Database Select コネクタを同じフローに追加する。
  5. データベースへの新しい接続を作成し(または既存の接続を編集し)、プロパティを設定する。
    • 接続を「Generic Connection」に設定
    • Required Libraries セクションでCData JDBC ドライバのJAR ファイルを指定する(例:cdata.jdbc.googledatacatalog.jar)。 JAR ファイルを追加(Salesforce の場合)。
    • Google Data Catalog の接続文字列にURL を指定

      Google Data Catalog 接続プロパティの取得・設定方法

      認証プロパティを追加する前に、次の接続プロパティを設定してください。

      • OrganizationId:接続するGoogle Cloud Platform の組織リソースに関連付けられたID。これはGCP コンソールに移動して確認してください。 「プロジェクト」ドロップダウンメニューを開き、リストから組織へのリンクをクリックします。このページから組織ID を取得できます。
      • ProjectId:接続するGCP のプロジェクトリソースに関連付けられたID。GCP コンソールのダッシュボードに移動し、「プロジェクトを選択」のメニューからお好みのプロジェクトを選択して確認してください。プロジェクトID は、「プロジェクト情報」項目に表示されます。

      Google Data Catalog への認証

      CData 製品は、認証にユーザーアカウント、サービスアカウント、およびGCP インスタンスアカウントの使用をサポートします。

      OAuth の設定方法については、ヘルプドキュメントの「OAuth」セクションを参照してください。

      組み込みの接続文字列デザイナ

      JDBC 用のURL の作成にサポートが必要な場合は、Google Data Catalog JDBC Driver に組み込まれた接続文字列デザイナを使用できます。JAR ファイルをダブルクリックするか、コマンドラインからJAR ファイルを実行してください。

      java -jar cdata.jdbc.googledatacatalog.jar

      接続プロパティを入力して、接続文字列をクリップボードにコピーします。

    • Driver クラス名をcdata.jdbc.googledatacatalog.GoogleDataCatalogDriver に指定します。 設定したデータベース接続(Salesforce の場合)。
    • 「接続テスト」をクリックします。
  6. SQL Query Text をGoogle Data Catalog のデータをリクエストするためのSQL クエリに設定します。例えば、SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'Select オブジェクトを設定(Salesforce の場合)
  7. Transform Message コンポーネントをフローに追加します。
  8. Output スクリプトを次のように設定して、ペイロードをJSON に変換します。
    %dw 2.0
    output application/json
    ---
    payload
            
    Transform Message コンポーネントをフローに追加
  9. Google Data Catalog のデータを閲覧するには、HTTP コネクタ用に設定したアドレスに移動します(デフォルトでは、localhost:8081):http://localhost:8081。Web ブラウザおよびJSON エンドポイントを使用可能な他のツール内で、Google Data Catalog のデータをJSON として利用できます。

これで、カスタムアプリケーションおよび他のさまざまなBI、帳票、ETL ツールからGoogle Data Catalog のデータを(JSON データとして)扱うための簡易なWeb インターフェースを作成できました。Mule アプリケーションからお好みのデータソースにアクセスできる、JDBC Driver for GoogleDataCatalog の30日の無償評価版のダウンロードはこちらから。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。