Ready to get started?

Learn more about the CData JDBC Driver for HPCC or download a free trial:

Download Now

HPCC Systems Data をR で分析

CData JDBC Driver for HPCC Systemsで標準的なR 関数とお好みの開発環境を使って、 HPCC Systems data を分析。



Pure R スクリプトおよび 標準SQL を使って、R およびJava をインストール可能なあらゆるマシン上でHPCC Systems data にアクセス。CData JDBC Driver for HPCC Systems とRJDBC package を使って、R でリモートHPCC Systems data を利用できます。CData Driver を使うことで、業界が認めた基準で書かれたドライバーを活用して、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってHPCC Systems にSQL クエリを実行する方法、および標準R 関数を呼び出してHPCC Systems data をビジュアライズする方法について説明します。

R をインストール

マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープン R を実行することによって、マルチスレッドおよびマネージドコードから利益を得られたドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。

RJDBC パッケージをロード

ドライバーを使うにはRJDBC パッケージをダウンロードします。RJDBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。

library(RJDBC)

JDBC データソースとしてHPCC Systems に接続

下記の情報を使いHPCC Systems にJDBC データソースとして接続します。

  • Driver Class:cdata.jdbc.hpcc.HPCCDriver に設定。
  • Classpath:Driver JAR の場所を設定します。デフォルトではインストールディレクトリの[lib]サブフォルダです。

dbConnect やdbSendQuery のようなDBI 関数は、R にデータアクセスコードを書くための統一インターフェースを提供します。

driver <- JDBC(driverClass = "cdata.jdbc.hpcc.HPCCDriver", classPath = "MyInstallationDir\lib\cdata.jdbc.hpcc.jar", identifier.quote = "'")

これで、DBI 関数を使ってHPCC Systems に接続しSQL クエリを実行する準備が整いました。dbConnect 関数を使ってJDBC 接続を初期化します。一般的なJDBC 接続文字列は次のとおりです。

conn <- dbConnect(driver,"URL=http://127.0.0.1:8510;User=test;password=xA123456;Version=1;Cluster=hthor;")

To connect, set the following connection properties: Set URL to the machine name or IP address of the server and the port the server is running on, for example, https://server:port. The User and Password are required to authenticate to the HPCC Systems cluster specified in the URL. Note that LDAP authentication is not currently supported by our ODBC driver.

Set Version to the WsSQL Web server version. Note that if you have not already done so, you will need to install the WsSQL service on the HPCC Systems server. The WsSQL Web service is used to interact with the underlying HPCC Systems platform.

Set Cluster to the target cluster.

スキーマ Discovery

ドライバーはHPCC Systems API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデルします。次のコードを使ってテーブルリストを検出します。

dbListTables(conn)

SQL クエリの実行

dbGetQuery 関数を使ってHPCC Systems API がサポートするすべてのSQL クエリを実行できます:

hpcc::test::orders <- dbGetQuery(conn,"SELECT SUM(hpcc::test::orders.Price), hpcc::test::customers.CustomerName FROM hpcc::test::orders INNER JOIN hpcc::test::customers ON hpcc::test::orders.CustomerId=hpcc::test::customers.CustomerId;GROUP BY hpcc::test::customers.CustomerName")

次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。

View(hpcc::test::orders)

HPCC Systems Data をプロット

CRAN レポジトリで利用可能なあらゆるデータ初期化パッケージを使ってHPCC Systems data を分析する準備が整いました。ビルトインバーのplot 関数を使って簡単なバーを作成できます。

par(las=2,ps=10,mar=c(5,15,4,2)) barplot(hpcc::test::orders$Price, main="HPCC Systems hpcc::test::orders", names.arg = hpcc::test::orders$CustomerName, horiz=TRUE)
 
 
ダウンロード