今すぐお試しください!

製品の詳細CData ODBC Driver for HPCC を確認して、無償評価版をダウンロード:

今すぐダウンロード

HPCC Systems データをR で分析

データビジュアライゼーション、ハイパフォーマンスな統計関数を使ってHPCC Systems をMicrosoft R Open で分析。



Pure R スクリプトおよび 標準SQL を使ってHPCC Systems にアクセス。CData ODBC Driver for HPCC Systems とRODBC package を使って、R でリモートHPCC Systems を利用できます。CData Driver を使うことで、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってHPCC Systems にSQL クエリを実行する方法、およびR でHPCC Systems をビジュアライズする方法について説明します。

R をインストール

マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープンR を実行することによって、マルチスレッドおよびマネージドコードからドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。

HPCC Systems ODBC Data Source としてHPCC Systems に連携

接続プロパティの指定がまだの場合は、まずODBC DSN (データソース名)で接続設定を行います。これはドライバーのインストール時に自動的に立ち上がります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。

To connect, set the following connection properties: Set URL to the machine name or IP address of the server and the port the server is running on, for example, https://server:port. The User and Password are required to authenticate to the HPCC Systems cluster specified in the URL. Note that LDAP authentication is not currently supported by our ODBC driver.

Set Version to the WsSQL Web server version. Note that if you have not already done so, you will need to install the WsSQL service on the HPCC Systems server. The WsSQL Web service is used to interact with the underlying HPCC Systems platform.

Set Cluster to the target cluster.

RODBC パッケージをロード

ドライバーを使うにはRODBC パッケージをダウンロードします。RStudio で[Tools]>[Install Packages]をクリックし、RODBC を[Packages]ボックスに入力します。

RODBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。

library(RODBC)

ODBC データソースとしてHPCC Systems データに連携

次のコードを使ってR のDSN に接続できます:

conn <- odbcConnect("CData HPCC Systems Source")

スキーマ検出

ドライバーはHPCC Systems API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデル化します。次のコードを使ってテーブルリストを検出します。

sqlTables(conn)

SQL クエリの実行

sqlQuery 関数を使ってHPCC Systems API がサポートするすべてのSQL クエリを実行します。

hpcc::test::orders <- sqlQuery(conn, "SELECT SUM(hpcc::test::orders.Price), hpcc::test::customers.CustomerName FROM hpcc::test::orders INNER JOIN hpcc::test::customers ON hpcc::test::orders.CustomerId=hpcc::test::customers.CustomerId;GROUP BY hpcc::test::customers.CustomerName", believeNRows=FALSE, rows_at_time=1)

次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。

View(hpcc::test::orders)

HPCC Systems データをプロット

これで、CRAN レポジトリで利用可能なあらゆるデータビジュアライゼーションパッケージを使ってHPCC Systems を分析できます。ビルトインのbar plot 関数を使って簡単なバーを作成できます:

par(las=2,ps=10,mar=c(5,15,4,2)) barplot(hpcc::test::orders$Price, main="HPCC Systems hpcc::test::orders", names.arg = hpcc::test::orders$CustomerName, horiz=TRUE)
 
 
ダウンロード