JDBC Data Source for Databricks との間にInformatica マッピングを作成

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks JDBC Driver

Databricks 連携のパワフルなJava アプリケーションを素早く作成して配布。



標準のJDBC 接続プロセスを使用して、Informatica でDatabricks データオブジェクトを作成します。JAR をコピーし、接続してください。

Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for Databricks を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でDatabricks を転送および参照する方法を示します。

ドライバーをデプロイ

ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.

Developer ツールでDatabricks を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。

  • Informatica-installation-directory\client\externaljdbcjars
  • Informatica-installation-directory\externaljdbcjars

JDBC 接続の作成

以下のステップに従って、Informatica Developer に接続します。

  1. [Connection Explorer]ペインで[domain]を右クリックし、[Create a Connection]をクリックします。
  2. 表示される[New Database Connection]ウィザードで、接続の名前とId を入力し、[Type]メニューで[JDBC]を選択します。
  3. [JDBC Driver Class Name]のプロパティで次のコードを入力します。 cdata.jdbc.databricks.DatabricksDriver
  4. [Connection String]プロパティでは、Databricks の接続プロパティを使用してJDBC URLを入力します。

    To connect to a Databricks cluster, set the properties as described below.

    Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

    • Server: Set to the Server Hostname of your Databricks cluster.
    • HTTPPath: Set to the HTTP Path of your Databricks cluster.
    • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、Databricks JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.databricks.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    以下は一般的な接続文字列です。

    jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;

Databricks テーブルを参照

ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のDatabricks エンティティにアクセスできるようになります。以下のステップに従ってDatabricks に接続し、Databricks テーブルを参照します。

  1. リポジトリに接続します。
  2. [Connection Explorer]で、[connection]を右クリックし、[Connect]をクリックします。
  3. [Show Default Schema Only]オプションをクリアします。

以下より、[Data Viewer]でDatabricks テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。

Databricks データオブジェクトの作成

以下のステップに従って、プロジェクトにDatabricks テーブルを追加します。

  1. Databricks でテーブルを選択し、右クリックして[Add to Project]をクリックします。
  2. 表示されるダイアログでリソースごとにデータオブジェクトを作成するオプションを選択します。
  3. [Select Location]ダイアログで、プロジェクトを選択します。

    マッピングの作成

    以下のステップに従って、マッピングにDatabricks ソースを追加します。

    1. [Object Explorer]でプロジェクトを右クリックし、[New]->[Mapping]と進みます。
    2. Databricks 接続のノードを展開し、テーブルのデータオブジェクトをエディターにドラッグします。.
    3. 表示されるダイアログで、[Read]オプションを選択します。

    以下のステップに従って、Databricks カラムをフラットファイルにマッピングします。

    1. [Object Explorer]でプロジェクトを右クリックし、[New]->[Data Object]と進みます。
    2. [Flat File Data Object]->[Create as Empty]->[Fixed Width]と選択していきます。
    3. Databricks オブジェクトのプロパティで必要な行を選択して右クリックし、[copy]をクリックします。行をフラットファイルのプロパティにペーストします。
    4. フラットファイルのデータオブジェクトをマッピングにドラッグします。
    5. 表示されるダイアログで、[Write]オプションを選択します。
    6. クリックしてドラッグすることで、列を接続します。

    Databricks を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。