製品をチェック

HDFS Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

HDFS アイコン HDFS JDBC Driver 相談したい

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

JDBC データソースでHDFS との間にInformatica マッピングを作成

標準のJDBC 接続プロセスを使用して、Informatica でHDFS データオブジェクトを作成します。JAR をコピーし、接続してください。

加藤龍彦
デジタルマーケティング

最終更新日:2022-01-06
hdfs ロゴ

CData

jdbc ロゴ画像
Informatica PowerCenter ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Informatica は、データを転送・変換するための強力で立派な手段を提供します。CData JDBC Driver for HDFS を利用することで、Informatica の強力なデータ転送および操作機能とシームレスに統合される、業界で実証済みの標準に基づくドライバーにアクセスできます。このチュートリアルでは、Informatica PowerCenter でHDFS を転送および参照する方法を示します。

ドライバーをデプロイ

ドライバーをInformatica PowerCenter サーバーに展開するために、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーします。Informatica-installation-directory\services\shared\jars\thirdparty.

Developer ツールでHDFS を使用するには、インストールディレクトリのlib サブフォルダにあるCData JAR および.lic ファイルを次のフォルダにコピーする必要があります。

  • Informatica-installation-directory\client\externaljdbcjars
  • Informatica-installation-directory\externaljdbcjars

JDBC 接続の作成

以下のステップに従って、Informatica Developer に接続します。

  1. [Connection Explorer]ペインで[domain]を右クリックし、[Create a Connection]をクリックします。
  2. 表示される[New Database Connection]ウィザードで、接続の名前とId を入力し、[Type]メニューで[JDBC]を選択します。
  3. [JDBC Driver Class Name]のプロパティで次のコードを入力します。 cdata.jdbc.hdfs.HDFSDriver
  4. [Connection String]プロパティでは、HDFS の接続プロパティを使用してJDBC URLを入力します。

    HDFS 接続プロパティの取得・設定方法

    HDFS への認証には、次の接続プロパティを設定します。

    • Host:HDFS インスタンスのホストに設定してください。
    • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、HDFS JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.hdfs.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

    以下は一般的な接続文字列です。

    jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;

HDFS テーブルを参照

ドライバーJAR をクラスパスに追加してJDBC 接続を作成すると、Informatica のHDFS エンティティにアクセスできるようになります。以下のステップに従ってHDFS に接続し、HDFS テーブルを参照します。

  1. リポジトリに接続します。
  2. [Connection Explorer]で、[connection]を右クリックし、[Connect]をクリックします。
  3. [Show Default Schema Only]オプションをクリアします。 The driver models HDFS entities as relational tables.(Salesforce is shown.)

以下より、[Data Viewer]でHDFS テーブルを参照できるようになります。テーブルの[node]を右クリックし、[Open]をクリックします。[Data Viewer]で[Run]をクリックします。

Table data and metadata in the Data Viewer.(Salesforce is shown.)

HDFS データオブジェクトの作成

以下のステップに従って、プロジェクトにHDFS テーブルを追加します。

  1. HDFS でテーブルを選択し、右クリックして[Add to Project]をクリックします。
  2. 表示されるダイアログでリソースごとにデータオブジェクトを作成するオプションを選択します。
  3. [Select Location]ダイアログで、プロジェクトを選択します。

    マッピングの作成

    以下のステップに従って、マッピングにHDFS ソースを追加します。

    1. [Object Explorer]でプロジェクトを右クリックし、[New]->[Mapping]と進みます。
    2. HDFS 接続のノードを展開し、テーブルのデータオブジェクトをエディターにドラッグします。.
    3. 表示されるダイアログで、[Read]オプションを選択します。
    The source HDFS table in the mapping.(Salesforce is shown.)

    以下のステップに従って、HDFS カラムをフラットファイルにマッピングします。

    1. [Object Explorer]でプロジェクトを右クリックし、[New]->[Data Object]と進みます。
    2. [Flat File Data Object]->[Create as Empty]->[Fixed Width]と選択していきます。
    3. HDFS オブジェクトのプロパティで必要な行を選択して右クリックし、[copy]をクリックします。行をフラットファイルのプロパティにペーストします。
    4. フラットファイルのデータオブジェクトをマッピングにドラッグします。
    5. 表示されるダイアログで、[Write]オプションを選択します。
    6. クリックしてドラッグすることで、列を接続します。

    HDFS を転送するために、ワークスペースで右クリックし、[Run Mapping]をクリックします。

    The completed mapping.(Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。