KNIME の標準データアクセスコンポーネントを使用してGoogle Data Catalog でチャートとレポートを作成します。
CData JDBC Driver for Google Data Catalog の強みの一つは、クロスプラットフォームのサポートであり、主要なBI ツールとの統合を可能にします。以下のステップに従って、KNIME のGoogle Data Catalog にアクセスし、レポートデザイナを使用してGoogle Data Catalog からチャートを作成します。
CData JDBC Driver for Google Data Catalog を使用することで、JDBC データソースとしてGoogle Data Catalog にアクセスでき、IDE の迅速な開発ツールとの統合が可能になります。この記事では、データソース構成ウィザードを使用してIntelliJ のGoogle Data Catalog に接続する方法を示します。
※製品について詳しい情報をご希望の方は以下からお進みください。
- Google Data Catalog にほかのBI、ETL、開発ツールから接続したい:Google Data Catalog データ連携ガイドおよびチュートリアルのリストへ
- Google Data Catalog Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
Google Data Catalog データへの新しいJDBC 接続を定義します。
- Report Designer 機能をインストールします。[File]->[Install KNIME Extensions]とクリックし、[Report]でフィルタリングします。
- 新しいワークフローで[File]->[Preferences]をクリックし、[KNIME]->[Databases]でノードを展開し cdata.jdbc.googledatacatalog.jar を追加します。
- ドライバーJAR は、インストールディレクトリのlib サブフォルダにあります。
-
[Node Repository]ビューで[Database]->[Read/Write]とノードを展開し、[Database Reader]をワークフローエディターにドラッグします。
-
[Database Reader]をダブルクリックし、次のプロパティを設定します。
- Database Driver:メニューでドライバーの名前(cdata.jdbc.googledatacatalog.GoogleDataCatalogDriver)を選択します。
Database URL:接続プロパティを入力します。jdbc:googledatacatalog: から始まり、その後にセミコロンで区切られた接続プロパティのリストが続くJDBC URL を入力します。
Google Data Catalog uses the OAuth authentication standard. Authorize access to Google APIs on behalf on individual users or on behalf of users in a domain.
Before connecting, specify the following to identify the organization and project you would like to connect to:
- OrganizationId: The ID associated with the Google Cloud Platform organization resource you would like to connect to. Find this by navigating to the cloud console.
Click the project selection drop-down, and select your organization from the list. Then, click More -> Settings. The organization ID is displayed on this page.
- ProjectId: The ID associated with the Google Cloud Platform project resource you would like to connect to.
Find this by navigating to the cloud console dashboard and selecting your project from the Select from drop-down. The project ID will be present in the Project info card.
When you connect, the OAuth endpoint opens in your default browser. Log in and grant permissions to the application to completes the OAuth process. For more information, refer to the OAuth section in the Help documentation.
ビルトイン接続文字列デザイナ
JDBC URL の構成については、Google Data Catalog JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.googledatacatalog.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。
以下は一般的なJDBC URL です。
jdbc:googledatacatalog:ProjectId=YourProjectId;InitiateOAuth=GETANDREFRESH
- OrganizationId: The ID associated with the Google Cloud Platform organization resource you would like to connect to. Find this by navigating to the cloud console.
- User Name:認証に使用されるユーザー名
- Password:認証に使用されるパスワード
- SQL Statement:[SQL Statement]ボックスにSQL クエリを入力するか、テーブルをダブルクリックします。この記事では、チャートの作成に以下のクエリを用います。
SELECT Type, DatasetName FROM Schemas WHERE ProjectId = 'bigquery-public-data'
-
[Fetch Metadata]をクリックして接続を確認します。
-
[Database Reader]を[Data to Report]ノードに接続し、データセットを様々なデータ可視化コントロールに提供します。[Execute]をクリックし、ワークフローの上部にある[Edit Report]をクリックしてレポートデザイナパースペクティブを開きます。
-
ライブデータに基づいてレポートを作成できます。チャートを作成するには、チャートコントロールをパレットからレポートデザイナにドラッグします。表示されるウィザードでは、KNIME で使用可能なフィルタリングおよび集約コントロールを使用できます。
トラブルシューティング
次のリストは一般的なエラーを解決する方法を示しています。
- [Row1]という重複するIdが見つかりました。:このエラーを解決するには、KNIME インストールディレクトリにあるknime.ini ファイルに
-Dknime.database.fetchsize=0
を追加します。