JRuby からHDFS にデータ連携

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS JDBC Driver

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。



リアルタイムHDFS に連携するシンプルなJRuby アプリケーションを作成します。

JRuby はRuby プログラミング言語の高性能で安定した、完全にスレッド化されたJava 実装です。CData JDBC Driver for HDFS を使用すると、JRuby からリアルタイムHDFS へのデータ連携を簡単に実装できます。ここでは、HDFS に接続し、クエリを実行して結果を表示する簡単なJRuby アプリを作成する方法を説明します。

HDFS データにJDBC で接続

アプリを作成する前に、JDBC Driver のJAR ファイルのインストール場所をメモします。 (通常はC:\Program Files\CDatat\CData JDBC Driver for HDFS\libにあります。)

JRuby は、JDBC をネイティブにサポートしているため、簡単にHDFS に接続してSQL クエリを実行できます。java.sql.DriverManager クラスのgetConnection 関数を使用してJDBC 接続を初期化します。

In order to authenticate, set the following connection properties:

  • Host: Set this value to the host of your HDFS installation.
  • Port: Set this value to the port of your HDFS installation. Default port: 50070

ビルトイン接続文字列デザイナー

JDBC URL の構成については、HDFS JDBC Driver に組み込まれている接続文字列デザイナーを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

java -jar cdata.jdbc.hdfs.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

以下はHDFS の一般的なJDBC 接続文字列です。

jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;

HDFS データへの接続性を持つJRuby アプリを作成

新しいRuby ファイル(例: HDFSSelect.rb) を作成してテキストエディタで開き、次のコードをファイルにコピーします。

require 'java' require 'rubygems' require 'C:/Program Files/CData/CData JDBC Driver for HDFS 2018/lib/cdata.jdbc.hdfs.jar' url = "jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;" conn = java.sql.DriverManager.getConnection(url) stmt = conn.createStatement rs = stmt.executeQuery("SELECT FileId, ChildrenNum FROM Files") while (rs.next) do puts rs.getString(1) + ' ' + rs.getString(2) end

ファイルが完成したら、コマンドラインからファイルを実行するだけでJRuby でHDFS を表示できるようになります。

jruby -S HDFSSelect.rb

SQL-92 クエリをHDFS に書き込むと、HDFS を独自のJRuby アプリケーションに素早く簡単に組み込むことができます。今すぐ無料トライアルをダウンロードしましょう。