Squirrel SQL Client からHDFS のデータに連携

HDFS に接続し、Squirrel SQL Client でクエリを実行します。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-10-03

この記事で実現できるHDFS 連携のシナリオ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData JDBC Driver for HDFS を使用して、Squirrel SQL Client などのツールでHDFS へのクエリを実行できます。この記事では、JDBC data source for HDFS を作成し、クエリを実行します。

JDBC Driver for HDFS を追加する

以下のステップに従ってドライバーJAR を追加します。

  1. Squirrel SQL で[Windows]->[View Drivers]と進みます。
  2. プラスアイコンをクリックし、[Add Driver]ウィザードを開きます。
  3. [Name]ボックスで、CData JDBC Driver for HDFS のようなドライバーのわかりやすい名前を入力します。
  4. [Example URL]ボックスで、jdbc:hdfs: と入力します。
  5. [Extra Class Path]タブで[Add]をクリックします。
  6. 表示される[file explorer]ダイアログで、インストールディレクトリのlib サブフォルダにあるドライバーのJAR ファイルを選択します。
  7. [List Drivers]をクリックして[Class Name]メニューにドライバーのクラス名(cdata.jdbc.hdfs.HDFSDriver) を入力します。
The definition for the JDBC data source.(Salesforce is shown.)

接続プロパティを定義する

以下のステップに従って、接続プロパティをドライバーエイリアスに保存します。

  1. [Windows]->[View Aliases]と進みます。
  2. エイリアスが一覧表示されているペインで、プラスアイコンをクリックします。
  3. 表示される[Add Alias]ウィザードで、JDBC ドライバーには以下のフィールドが要求されます。

    • Name:CData HDFS Source のようなエイリアスの名前を入力します。
    • Driver:CData JDBC Driver for HDFS を選択します。
    • URL:jdbc:hdfs: と入力します。
    • User Name:ユーザー名を入力すると、JDBC URL に追加されます。
    The alias definition, containing the connection parameters.(Salesforce is shown.)
  4. 追加のプロパティを定義する場合は、[Properties]をクリックします。
  5. 表示されるダイアログの[Driver properties]タブで、[Use driver properties]のチェックボックスを選択します。
  6. [Specify]カラムで必要な接続プロパティのチェックボックスを選択します。

    HDFS 接続プロパティの取得・設定方法

    HDFS への認証には、次の接続プロパティを設定します。

    • Host:HDFS インスタンスのホストに設定してください。
    • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。

    以下は一般的な接続文字列です。

    jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root; Connection properties automatically detected by Squirrel SQL.(Salesforce is shown.)
  7. [OK]をクリックし、表示されるダイアログで[connect]をクリックして接続を確認します。

スキーマを検出しHDFS のデータをクエリする

メタデータが読み込まれると、HDFS のデータソースの新しいタブが表示されます。[Objects]サブタブでは、使用可能なテーブルやビューなどのスキーマ情報を見つけることができます。

Column metadata for a table.(Salesforce is shown.)

テーブルデータを表示するには[Objects]タブでテーブルを選択します。その後、テーブルデータが[Content]タブのグリッドに読み込まれます。

Tables can be edited on the Content tab.(Salesforce is shown.)

SQL クエリを実行するには、[SQL]タブにクエリを入力し、[Run SQL](ランナーアイコン)をクリックします。例:

SELECT FileId, ChildrenNum FROM Files WHERE FileId = '119116' A query and the results.(Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。