Alteryx DesignerにてHBase データを、データプレパレーション・データブレンディング・分析

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HBase ODBC Driver

HBase ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからHBase データベースへの接続を実現するパワフルなツールです。

RDB にアクセスするときと同感覚でHBase にアクセスし、標準ODBC Driver インターフェースを通じて読み出し、書き込み、更新が可能に。



セルフサービスデータアナリティクスのためのHBase へのライブ接続のWorkflowを構築

HBase 用のCData ODBCドライバは、ODBC標準のHBase からのライブデータへのアクセスを可能にし、使い慣れたSQL クエリで多種多様なBI、レポート、ETL ツールでHBase を扱うことができます 。 この記事では、セルフサービスBI、データプレパレーション、データブレンディング、アドバンスドアナリティクスを得意とするAlteryx Designer でODBC 接続を使用してHBaseに接続して利用する方法を示します。

※製品について詳しい情報をご希望の方は以下からお進みください。

HBase データへの接続

  1. まだ行っていない場合は、データソース名(DSN)に必要な接続プロパティの値を入力します。 組み込みのMicrosoft ODBC データソースアドミニストレーターを使用してDSN を構成できます。 これは、ドライバのインストールじの最後のステップでも可能です。 Microsoft ODBC データソースアドミニストレータを使用してDSN を作成および設定する方法については、ヘルプドキュメントの「はじめに」の章を参照してください。

    Apache HBase への接続には、Port およびServer を設定します。

  2. Alteryx Designer を開いて新しいワークフローを作成します。
  3. 新しいInput Data ToolをWorkflowにドラッグ&ドロップします。
  4. 新しい input data toolをクリックして、File or Database 下の「Database Connection -> New ODBC Connection...」を選択します。
  5. Alteryx用に定義下設定済みDSNを選択します。
  6. 開かれたウィザードの中で、クエリーに含めたいフィールドを選択します。
  7. HBase 内のデータを要件にあった内容で正確に取得しているかを確認する場合には、SQLEditor を開き、クエリーを手動で変更することができます。

クエリー定義で、Alteryx Designer 内でHBase への接続の準備ができました。

HBase に対するセルフサービス分析の実行

これで、HBase のデータプレパレーション、ブレんディング、分析を行うワークフローを作成する準備が整いました。 以下の例では、データを整理して参照します。

  1. workflow にデータクレンジングツールを追加し、Null テキストフィールドをブランクに置き換え、ヌル数値フィールドを0に置き換えるには、NULL を置き換えるのボックスをオンにします。また、不要な文字を削除するにチェックを入れて先頭と末尾の空白を削除することもできます。
  2. workflow にbrowse data tool を追加します。
  3. run the workflow (CTRL+R) をクリック。
  4. 結果ビューにてクレンジングされたHBase データを確認します。