ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →HDFS ODBC Driver の30日間無償トライアルをダウンロード
30日間の無償トライアルへ製品の詳細
HDFS ODBC Driver 相談したいHDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。
HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで連携。
CData
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for HDFS を合わせて使うことで、SAS からリアルタイムHDFS データへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でHDFS のライブラリを作成し、リアルタイムHDFS に基づいたシンプルなレポートを作成します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でリアルタイムHDFS データを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からHDFS に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をHDFS に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でHDFS を簡単にビジュアライズおよび分析できます。
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
CData ODBC ドライバでは、1.データソースとしてHDFS の接続を設定、2.SAS 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
まずは、本記事右側のサイドバーからHDFS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
以下は、HDFS に接続するための情報と、Windows およびLinux 環境でDSN を構成するためのステップです。
HDFS への認証には、次の接続プロパティを設定します。
DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。
Linux 環境にCData ODBC Driver for HDFS をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。
[CData HDFS Sys]
Driver = CData ODBC Driver for HDFS
Description = My Description
Host = sandbox-hdp.hortonworks.com
Port = 50070
Path = /user/root
User = root
これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。
CData ODBC Driver for HDFS に基づくライブラリを追加することで、SAS でHDFS に接続します。
SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にリアルタイムHDFS データにクエリを実行することを意味します。
proc sql; create view files_view as select fileid, childrennum from odbclib.files where FileId = '119116'; quit;
ローカルビューを作成すると、パワフルなSAS 機能を使用してHDFS データをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。
proc print data=files; title "HDFS Files Data"; run;
proc gchart data=files; pie fileid / sumvar=childrennum value=arrow percent=arrow noheading percent=inside plabel=(height=12pt) slice=inside value=none name='FilesChart'; run;
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。