Ready to get started?

Learn more about the CData ODBC Driver for Snowflake or download a free trial:

Download Now

Snowflake Data をR で分析

データビジュアライゼーション、ハイパフォーマンスな統計関数を使ってSnowflake data をMicrosoft R Open で分析。



Pure R スクリプトおよび 標準SQL を使ってSnowflake data にアクセス。CData ODBC Driver for Snowflake とRODBC package を使って、R でリモートSnowflake data を利用できます。CData Driver を使うことで、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってSnowflake data にSQL クエリを実行する方法、およびR でSnowflake data をビジュアライズする方法について説明します。

R をインストール

マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープンR を実行することによって、マルチスレッドおよびマネージドコードからドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。

Snowflake ODBC Data Source としてSnowflake に接続

接続プロパティの指定がまだの場合は、まずODBC DSN (データソース名)で接続設定を行います。これはドライバーのインストール時に自動的に立ち上がります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。

To connect to Snowflake:

  1. Set User and Password to your Snowflake credentials and set the AuthScheme property to PASSWORD or OKTA.
  2. Set URL to the URL of the Snowflake instance (i.e.: https://myaccount.snowflakecomputing.com).
  3. Set Warehouse to the Snowflake warehouse.
  4. (Optional) Set Account to your Snowflake account if your URL does not conform to the format above.
  5. (Optional) Set Database and Schema to restrict the tables and views exposed.

See the Getting Started guide in the CData driver documentation for more information.

RODBC パッケージをロード

ドライバーを使うにはRODBC パッケージをダウンロードします。RStudio で[Tools]>[Install Packages]をクリックし、RODBC を[Packages]ボックスに入力します。

RODBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。

library(RODBC)

ODBC データソースとしてSnowflake Data に接続

次のコードを使ってR のDSN に接続できます:

conn <- odbcConnect("CData Snowflake Source")

スキーマ ディスカバリー

ドライバーはSnowflake API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデル化します。次のコードを使ってテーブルリストを検出します。

sqlTables(conn)

SQL クエリの実行

sqlQuery 関数を使ってSnowflake API がサポートするすべてのSQL クエリを実行します。

products <- sqlQuery(conn, "SELECT Id, ProductName FROM Products", believeNRows=FALSE, rows_at_time=1)

次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。

View(products)

Snowflake Data をプロット

これで、CRAN レポジトリで利用可能なあらゆるデータビジュアライゼーションパッケージを使ってSnowflake data を分析できます。ビルトインのbar plot 関数を使って簡単なバーを作成できます:

par(las=2,ps=10,mar=c(5,15,4,2)) barplot(products$ProductName, main="Snowflake Products", names.arg = products$Id, horiz=TRUE)
 
 
ダウンロード