Azure Data Catalog データをR で分析

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Azure Data Catalog JDBC Driver

Azure Data Catalog データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。



CData JDBC Driver for Azure Data Catalogで標準的なR 関数とお好みの開発環境を使って、 Azure Data Catalog を分析。



Pure R スクリプトおよび 標準SQL を使って、R およびJava をインストール可能なあらゆるマシン上でAzure Data Catalog にアクセス。CData JDBC Driver for Azure Data Catalog とRJDBC package を使って、R でリモートAzure Data Catalog data を利用できます。CData Driver を使うことで、業界が認めた基準で書かれたドライバーを活用して、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってAzure Data Catalog にSQL クエリを実行する方法、および標準R 関数を呼び出してAzure Data Catalog をビジュアライズする方法について説明します。

R をインストール

マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープン R を実行することによって、マルチスレッドおよびマネージドコードから利益を得られたドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。

RJDBC パッケージをロード

ドライバーを使うにはRJDBC パッケージをダウンロードします。RJDBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。

library(RJDBC)

JDBC データソースとしてAzure Data Catalog に接続

下記の情報を使いAzure Data Catalog にJDBC データソースとして接続します。

  • Driver Class:cdata.jdbc.azuredatacatalog.AzureDataCatalogDriver に設定。
  • Classpath:Driver JAR の場所を設定します。デフォルトではインストールディレクトリの[lib]サブフォルダです。

dbConnect やdbSendQuery のようなDBI 関数は、R にデータアクセスコードを書くための統一インターフェースを提供します。

driver <- JDBC(driverClass = "cdata.jdbc.azuredatacatalog.AzureDataCatalogDriver", classPath = "MyInstallationDir\lib\cdata.jdbc.azuredatacatalog.jar", identifier.quote = "'")

これで、DBI 関数を使ってAzure Data Catalog に接続しSQL クエリを実行する準備が整いました。dbConnect 関数を使ってJDBC 接続を初期化します。一般的なJDBC 接続文字列は次のとおりです。

conn <- dbConnect(driver,"")

You can optionally set the following to read the different catalog data returned from Azure Data Catalog.

    CatalogName: Set this to the CatalogName associated with your Azure Data Catalog. To get your Catalog name, navigate to your Azure Portal home page > Data Catalog > Catalog Name

Connect Using OAuth Authentication

You must use OAuth to authenticate with Azure Data Catalog. OAuth requires the authenticating user to interact with Azure Data Catalog using the browser. For more information, refer to the OAuth section in the help documentation.

スキーマ Discovery

ドライバーはAzure Data Catalog API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデルします。次のコードを使ってテーブルリストを検出します。

dbListTables(conn)

SQL クエリの実行

dbGetQuery 関数を使ってAzure Data Catalog API がサポートするすべてのSQL クエリを実行できます:

tables <- dbGetQuery(conn,"SELECT DslAddressDatabase, Type FROM Tables WHERE Name = 'FactProductInventory'")

次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。

View(tables)

Azure Data Catalog Data をプロット

CRAN レポジトリで利用可能なあらゆるデータ初期化パッケージを使ってAzure Data Catalog を分析する準備が整いました。ビルトインバーのplot 関数を使って簡単なバーを作成できます。

par(las=2,ps=10,mar=c(5,15,4,2)) barplot(tables$Type, main="Azure Data Catalog Tables", names.arg = tables$DslAddressDatabase, horiz=TRUE)