製品をチェック

Amazon Redshift Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Amazon Redshift アイコン Amazon Redshift JDBC Driver 相談したい

Amazon Redshift データ連携のパワフルなJava アプリケーションを素早く作成して配布。

Redshift データをR で分析

CData JDBC Driver で標準的なR 関数とお好みの開発環境を使ってRedshift を分析。

加藤龍彦
デジタルマーケティング

最終更新日:2023-09-21
redshift ロゴ

CData

jdbc ロゴ画像
R ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Pure R スクリプトおよび 標準SQL を使って、R およびJava をインストール可能なあらゆるマシン上でRedshift にアクセス。CData JDBC Driver for Redshift とRJDBC package を使って、R でリモートRedshift データ を利用できます。CData Driver を使うことで、業界が認めた基準で書かれたドライバーを活用して、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってRedshift にSQL クエリを実行する方法、および標準R 関数を呼び出してRedshift をビジュアライズする方法について説明します。

R をインストール

マルチスレッドのMicrosoft R Open を実行すること、またはBLAS/LAPACK ライブラリにリンクされたオープン R を実行することによって、マルチスレッドおよびマネージドコードから利益を得られたドライバーのパフォーマンスにマッチできます。ここでは、Microsoft R Open 3.2.3 を使用します。CRAN レポジトリのJan. 1, 2016 snapshot からパッケージをインストールするために事前設定されています。このsnapshot は再現性を保証します。

RJDBC パッケージをロード

ドライバーを使うにはRJDBC パッケージをダウンロードします。RJDBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。

library(RJDBC)

JDBC データソースとしてRedshift に接続

下記の情報を使いRedshift にJDBC データソースとして接続します。

  • Driver Class:cdata.jdbc.redshift.RedshiftDriver に設定。
  • Classpath:Driver JAR の場所を設定します。デフォルトではインストールディレクトリの[lib]サブフォルダです。

dbConnect やdbSendQuery のようなDBI 関数は、R にデータアクセスコードを書くための統一インターフェースを提供します。

driver <- JDBC(driverClass = "cdata.jdbc.redshift.RedshiftDriver", classPath = "MyInstallationDir\lib\cdata.jdbc.redshift.jar", identifier.quote = "'")

これで、DBI 関数を使ってRedshift に接続しSQL クエリを実行する準備が整いました。dbConnect 関数を使ってJDBC 接続を初期化します。一般的なJDBC 接続文字列は次のとおりです。

conn <- dbConnect(driver,"User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;")

Redshift への接続には次を設定します:

  • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
  • Port: クラスタのポート。
  • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
  • User: ユーザー名。
  • Password: ユーザーのパスワード。

Server およびPort の値はAWS の管理コンソールで取得可能です:

  1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
  2. Clusters ページで、クラスタ名をクリック。
  3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。

    スキーマ Discovery

    ドライバーはRedshift API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデルします。次のコードを使ってテーブルリストを検出します。

    dbListTables(conn)

    SQL クエリの実行

    dbGetQuery 関数を使ってRedshift API がサポートするすべてのSQL クエリを実行できます:

    orders <- dbGetQuery(conn,"SELECT ShipName, ShipCity FROM Orders")

    次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。

    View(orders)

    Redshift データ をプロット

    CRAN レポジトリで利用可能なあらゆるデータ初期化パッケージを使ってRedshift を分析する準備が整いました。ビルトインバーのplot 関数を使って簡単なバーを作成できます。

    par(las=2,ps=10,mar=c(5,15,4,2)) barplot(orders$ShipCity, main="Redshift Orders", names.arg = orders$ShipName, horiz=TRUE) A basic bar plot. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。