製品をチェック

Apache Hive Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Hive アイコン Apache Hive JDBC Driver 相談したい

Apache Hive 互換ディストリビューション連携のパワフルなJava アプリケーションを素早く作成して配布。

Hive データに連携しTalend からデータに接続

Hive をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-09-15
hive ロゴ

CData

jdbc ロゴ画像
Talend ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。



この記事では、Talend で簡単にCData JDBC Driver for ApacheHive をワークフローに統合してHive データ連携する方法を説明します。ここではCData JDBC Driver for ApacheHive を使ってTalend でHive をジョブフローに転送します。

JDBC データソースとしてTalend でHive に接続

下記の手順に従って、Hive にJDBC 接続を確立します:

  1. Hive を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
  2. ウィザードが表示されたら、接続に名前を入力します。
  3. 次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

    以下は一般的なJDBC URL です:

    jdbc:apachehive:Server=127.0.0.1;Port=10000;TransportMode=BINARY;
  4. インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.apachehive.jar ファイルへのパスを入力します。
  5. The connection to the JDBC data source. (QuickBooks is shown.)
  6. 接続を右クリックして[Retrieve Schema]をクリックします。
  7. デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
  8. デフォルトオプションでウィザードを終了します。

Customers テーブルをフラットファイルに出力

下記の手順に従って、Customers テーブルをフラットファイル出力コンポーネントに転送します:

  1. [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
  2. ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
  3. 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
  4. Customers tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。 A simple transfer to a flat file. (QuickBooks is shown.)

プロジェクトを実行してデータを転送します。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。