本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for FTP を合わせて使うことで、SAS からライブFTP データへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でFTP のライブラリを作成し、リアルタイムFTP に基づいたシンプルなレポートを作成します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でライブFTP データを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からFTP に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をFTP に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でFTP を簡単にビジュアライズおよび分析できます。
以下は、FTP に接続するための情報と、Windows およびLinux 環境でDSN を構成するための様々なステップです。ODBC Driver for FTP は、SAS System をホストしているマシンにインストールする必要があります。
FTP は、プレーンテキスト接続およびSSL/TLS 接続の両方をサポートします。FTP サーバーに接続するには、RemoteHost、User、およびPassword を指定します。SSLMode およびSSLServerCert を設定して、TSL/SSL による接続をセキュアにします。TLS/SSL を介した接続の設定について詳しくは、ヘルプドキュメントの「高度な設定」を参照してください。
次の接続プロパティを設定し、ファイルシステムのリレーショナルビューをコントロールします。
ストアドプロシージャ は、ファイル、のダウンロード、アップロード、およびプロトコルコマンドの送信に利用できます。 SQL を使用してサーバーと対話する方法の詳細については、ヘルプドキュメントの「データモデル」を参照してください。
DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Linux 環境にCData ODBC Driver for FTP をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。
[CData FTP Sys]
Driver = CData ODBC Driver for FTP
Description = My Description
RemoteHost = MyFTPServer
これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。
CData ODBC Driver for FTP に基づくライブラリを追加することで、SAS でFTP に接続します。
SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にライブFTP データにクエリを実行することを意味します。
proc sql; create view mydirectory_view as select filesize, filename from odbclib.mydirectory where FilePath = '/documents/doc.txt'; quit;
ローカルビューを作成すると、パワフルなSAS 機能を使用してFTP データをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。
proc print data=mydirectory; title "FTP MyDirectory Data"; run;
proc gchart data=mydirectory; pie filesize / sumvar=filename value=arrow percent=arrow noheading percent=inside plabel=(height=12pt) slice=inside value=none name='MyDirectoryChart'; run;