本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →
Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for Databricks を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でDatabricks を転送および参照する方法を示します。
ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.
Developer ツールでDatabricks を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。
以下のステップに従って、Informatica Developer に接続します。
cdata.jdbc.databricks.DatabricksDriver
To connect to a Databricks cluster, set the properties as described below.
Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.
JDBC URL の構成については、Databricks JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.databricks.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のDatabricks エンティティにアクセスできるようになります。以下のステップに従ってDatabricks に接続し、Databricks テーブルを参照します。
以下より、[Data Viewer]でDatabricks テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。
以下のステップに従って、プロジェクトにDatabricks テーブルを追加します。
以下のステップに従って、マッピングにDatabricks ソースを追加します。
以下のステップに従って、Databricks カラムをフラットファイルにマッピングします。
Databricks を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。