各製品の資料を入手。
詳細はこちら →IBM Cloud Data Engine のデータをR で分析:JDBC での接続
CData JDBC Driver で標準的なR 関数とお好みの開発環境を使ってIBM Cloud Data Engine を分析。
最終更新日:2023-09-21
この記事で実現できるIBM Cloud Data Engine 連携のシナリオ
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
CData JDBC Driver for IBMCloudDataEngine とRJDBC package を使って、R でリモートIBM Cloud Data Engine データ を利用できます。CData Driver を使うことで、業界が認めた基準で書かれたドライバーを活用して、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってIBM Cloud Data Engine にSQL クエリを実行する方法、および標準R 関数を呼び出してIBM Cloud Data Engine をビジュアライズする方法について説明します。
R をインストール
マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープン R を実行することによって、マルチスレッドおよびマネージドコードから利益を得られたドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。
RJDBC パッケージをロード
ドライバーを使うにはRJDBC パッケージをダウンロードします。RJDBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。
library(RJDBC)
JDBC データソースとしてIBM Cloud Data Engine に接続
下記の情報を使いIBM Cloud Data Engine にJDBC データソースとして接続します。
- Driver Class:cdata.jdbc.ibmclouddataengine.IBMCloudDataEngineDriver に設定。
- Classpath:Driver JAR の場所を設定します。デフォルトではインストールディレクトリの[lib]サブフォルダです。
dbConnect やdbSendQuery のようなDBI 関数は、R にデータアクセスコードを書くための統一インターフェースを提供します。
driver <- JDBC(driverClass = "cdata.jdbc.ibmclouddataengine.IBMCloudDataEngineDriver", classPath = "MyInstallationDir\lib\cdata.jdbc.ibmclouddataengine.jar", identifier.quote = "'")
これで、DBI 関数を使ってIBM Cloud Data Engine に接続しSQL クエリを実行する準備が整いました。dbConnect 関数を使ってJDBC 接続を初期化します。一般的なJDBC 接続文字列は次のとおりです。
conn <- dbConnect(driver,"Api Key=MyAPIKey;Instance CRN=myInstanceCRN;Region=myRegion;Schema=mySchema;OAuth Client Id=myOAuthClientId;OAuth Client Secret=myOAuthClientSecret;")
IBM Cloud Data Engine は、OAuth およびHMAC 認証標準を使います。詳細はヘルプドキュメントを参照してください。
スキーマ Discovery
ドライバーはIBM Cloud Data Engine API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデルします。次のコードを使ってテーブルリストを検出します。
dbListTables(conn)
SQL クエリの実行
dbGetQuery 関数を使ってIBM Cloud Data Engine API がサポートするすべてのSQL クエリを実行できます:
jobs <- dbGetQuery(conn,"SELECT Id, Status FROM Jobs WHERE UserId = [email protected]")
次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。
View(jobs)
IBM Cloud Data Engine データ をプロット
CRAN レポジトリで利用可能なあらゆるデータ初期化パッケージを使ってIBM Cloud Data Engine を分析する準備が整いました。ビルトインバーのplot 関数を使って簡単なバーを作成できます。
par(las=2,ps=10,mar=c(5,15,4,2)) barplot(jobs$Status, main="IBM Cloud Data Engine Jobs", names.arg = jobs$Id, horiz=TRUE)
