SAS JMP でのCData ODBC Driver for HDFS の使用

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS ODBC Driver

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで双方向連携。



CData ODBC Driver を使用して、HDFS をSAS JMP で使用可能な統計分析ツールに統合できます。この記事では、Graph Builder とQuery Builder でHDFS を表示する方法について説明します。

また、CData ODBC Driver for HDFS を使用して、ライブデータをSAS JMP との統計分析に統合できます。ドライバーは、クエリを直接HDFS API にプロキシし、分析がデータへの変更を反映していることを確認します。CData ODBC Driver は、レポートをデザインする際バックグラウンドでJMP によって使用される、標準SQL をサポートします。

この記事では、HDFS をレポートにアクセスし、データのビジュアライゼーションを作成する方法を説明します。また、SQL を使用してJMP Query Builder からHDFS データをクエリする方法も説明します。

ODBC Data Source としてHDFS データにアクセス

未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

In order to authenticate, set the following connection properties:

  • Host: Set this value to the host of your HDFS installation.
  • Port: Set this value to the port of your HDFS installation. Default port: 50070

DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。

Query Builder でHDFS データをインポート

HDFS DSN を作成したら、SQL を使用してHDFS API の機能を呼び出すことができます。以下のステップに従ってQuery Builder でサポートされているクエリを実行します。

  1. SAS JMP で[File]->[Database]->[Query Builder]とクリックします。[Select Database Connection]ダイアログが表示されます。
  2. [New Connection]をクリックします。
  3. [Machine Data Source]タブで[DSN]を選択します。次のステップでは、[Select Tables for Query]ダイアログが表示されます。
  4. [Available Tables]セクションでテーブルを選択し、[Primary]をクリックします。
  5. [Available Columns]を[Included Columns]タブにドラッグすると、基になるSQL クエリが更新されます。
  6. データを表示するには[Run Query]をクリックします。
  7. 結果を現在のデータで更新するには、[Update from Database]を右クリックし、[Run Script]をクリックします。

HDFS データをビジュアライズ

インポート後、Graph Builder を使用して視覚的にグラフを作成できます。Graph Builder を開くには、ツールバーの[Graph Builder]ボタンをクリックします。

  1. ディメンションカラムをx 軸にドラッグします。例:FileId
  2. メジャーカラムをy 軸にドラッグします。例:ChildrenNum
  3. チャートタイプを選択します。例:棒グラフ