ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →30日間の無償トライアル
無償トライアルはこちら製品の詳細
Avro ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからAvro のリアルタイムなデータに直接接続できるパワフルなツールです。
標準ODBC Driver インターフェースを使い、データベース感覚でAvro データにアクセスできます。
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
R スクリプトおよび 標準SQL を使ってAvro にアクセス。CData ODBC Driver for Avro とRODBC package を使って、R でリモートAvro を利用できます。CData Driver を使うことで、オープンソースでポピュラーなR 言語のデータにアクセスできます。この記事では、ドライバーを使ってAvro にSQL クエリを実行する方法、およびR でAvro をビジュアライズする方法について説明します。
CData ODBC Drivers は、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
CData ODBC Driver では、1.データソースとしてAvro の接続を設定、2.R 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
まずは、本記事右側のサイドバーからAvro ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
接続プロパティの指定がまだの場合は、まずODBC DSN (データソース名)で接続設定を行います。これはドライバーのインストール時に自動的に立ち上がります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
URI 接続プロパティをAvro ファイルの場所に設定して、ローカルのAvro ファイルに接続します。
ドライバーを使うにはRODBC パッケージをダウンロードします。RStudio で[Tools]>[Install Packages]をクリックし、RODBC を[Packages]ボックスに入力します。
RODBC パッケージをインストールしたら、次のコードを入力してパッケージをロードします。
library(RODBC)
次のコードを使ってR のDSN に接続できます:
conn <- odbcConnect("CData Avro Source")
ドライバーはAvro API をリレーショナルデータベース、ビュー、ストアドプロシージャとしてモデル化します。次のコードを使ってテーブルリストを検出します。
sqlTables(conn)
sqlQuery 関数を使ってAvro API がサポートするすべてのSQL クエリを実行します。
sampletable_1 <- sqlQuery(conn, "SELECT Id, Column1 FROM SampleTable_1 WHERE Column2 = 'value_2'", believeNRows=FALSE, rows_at_time=1)
次のコマンドを使って、結果を[data viewer]ウィンドウで見ることができます。
View(sampletable_1)
これで、CRAN レポジトリで利用可能なあらゆるデータビジュアライゼーションパッケージを使ってAvro を分析できます。ビルトインのbar plot 関数を使って簡単なバーを作成できます:
par(las=2,ps=10,mar=c(5,15,4,2))
barplot(sampletable_1$Column1, main="Avro SampleTable_1", names.arg = sampletable_1$Id, horiz=TRUE)
このようにCData ODBC Drivers と併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC Driver は日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。