各製品の資料を入手。
詳細はこちら →SAS でCData ODBC Driver for Greenplum を使用
CData ODBC Driver を使用してSAS からリアルタイムGreenplum に接続します。
最終更新日:2022-03-10
この記事で実現できるGreenplum 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for Greenplum を合わせて使うことで、SAS からリアルタイムGreenplum のデータへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でGreenplum のライブラリを作成し、リアルタイムGreenplum に基づいたシンプルなレポートを作成します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でリアルタイムGreenplum のデータを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からGreenplum に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をGreenplum に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でGreenplum を簡単にビジュアライズおよび分析できます。
CData ODBC ドライバとは?
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
- Greenplum をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
- 多様なアプリケーション、ツールにGreenplum のデータを連携
- ノーコードでの手軽な接続設定
- 標準 SQL での柔軟なデータ読み込み・書き込み
CData ODBC ドライバでは、1.データソースとしてGreenplum の接続を設定、2.SAS 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
CData ODBC ドライバのインストールとGreenplum への接続設定
まずは、本記事右側のサイドバーからGreenplum ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
以下は、Greenplum に接続するための情報と、Windows およびLinux 環境でDSN を構成するためのステップです。
Greenplum に接続するには、Server、Port (デフォルトポートは5432)、およびDatabase 接続プロパティを設定して、サーバーへの認証に使用するUser とPassword を設定します。Database プロパティが指定されていない場合、CData 製品はユーザーのデフォルトデータベース(ユーザーと同じ名前になります)に接続します。
DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。
Windows
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Linux
Linux 環境にCData ODBC Driver for Greenplum をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。
/etc/odbc.ini
[CData Greenplum Sys]
Driver = CData ODBC Driver for Greenplum
Description = My Description
User = user
Password = admin
Database = dbname
Server = 127.0.0.1
Port = 5432
これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。
SAS でGreenplum ライブラリを作成
CData ODBC Driver for Greenplum に基づくライブラリを追加することで、SAS でGreenplum に接続します。
- SAS を開き、[Explorer]ペインで[Libraries]を展開します。
- [Active Libraries]ウィンドウで右クリックし、[New]を選択します。
- ライブラリに名前を付け(odbclib)、Engine としてODBC を選択し、ライブラリをセッション間で保持する場合は[Enable at startup]をクリックします。
- Data Source を以前構成したDSN に設定し、[OK]をクリックします。
Greenplum クエリからビューを作成
SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にリアルタイムGreenplum のデータにクエリを実行することを意味します。
クエリツールの使用
- SAS で[Tools]->[Query]と進みます。
- データをプルするテーブルソースとテーブルを選択し、[OK]をクリックします。
- カラムを選択し、右クリックしてフィルタリング、順序付け、グループ化などを追加します。
- [SQL Query Tool]ウィンドウを右クリックして[Show Query]を選択し、[Create View]をクリックして、クエリの結果を含むローカルビューを作成します。ビューに名前を付け、[OK] をクリックします。
PROC SQL の使用
- SAS で、[Editor]ウィンドウに移動します。
- PROC SQL を使用してデータをクエリし、ローカルビューを作成します。
Note:このステップにより、[Work]ライブラリにビューが作成されます。オプションとして、create view ステートメントでライブラリを指定できます。proc sql; create view orders_view as select freight, shipname from odbclib.orders where ShipCountry = 'USA'; quit;
- [Run]->[Submit]とクリックしてクエリを実行し、ローカルビューを作成します。
SAS のGreenplum のデータに関するレポートまたはビジュアライズ
ローカルビューを作成すると、パワフルなSAS 機能を使用してGreenplum のデータをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。
HTML を印刷
- SAS で、[Editor]ウィンドウに移動します。
- PROC PRINT を使用してGreenplum Orders データのHTML レポートを印刷します。
proc print data=orders; title "Greenplum Orders Data"; run;
チャートを印刷
- SAS で、[Editor]ウィンドウに移動します。
- PROC GCHART を使用してOrders データのチャートを作成します。
proc gchart data=orders; pie freight / sumvar=shipname value=arrow percent=arrow noheading percent=inside plabel=(height=12pt) slice=inside value=none name='OrdersChart'; run;
Greenplum からSAS へのデータ連携には、ぜひCData ODBC ドライバをご利用ください
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。