セルフサービスデータアナリティクスのためのHPCC Systems へのライブ接続のWorkflowを構築
HPCC Systems 用のCData ODBCドライバは、ODBC標準のHPCC Systems からのライブデータへのアクセスを可能にし、使い慣れたSQL クエリで多種多様なBI、レポート、ETL ツールでHPCC Systems を扱うことができます 。 この記事では、セルフサービスBI、データプレパレーション、データブレンディング、アドバンスドアナリティクスを得意とするAlteryx Designer でODBC 接続を使用してHPCC Systemsに接続して利用する方法を示します。
※製品について詳しい情報をご希望の方は以下からお進みください。
- HPCC Systems にほかのBI、ETL、開発ツールから接続したい:HPCC Systems データ連携ガイドおよびチュートリアルのリストへ
- HPCC Systems Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
HPCC Systems データへの接続
- まだ行っていない場合は、データソース名(DSN)に必要な接続プロパティの値を入力します。 組み込みのMicrosoft ODBC データソースアドミニストレーターを使用してDSN を構成できます。 これは、ドライバのインストールじの最後のステップでも可能です。 Microsoft ODBC データソースアドミニストレータを使用してDSN を作成および設定する方法については、ヘルプドキュメントの「はじめに」の章を参照してください。
接続するには、次の接続プロパティを設定します。Url をサーバーのマシン名もしくはIP アドレス、およびサーバーが起動しているポートに設定します。例えば、https://server:port。Url で指定されたHPCC システムへの認証には、User およびPassword が必要です。LDAP 認証は、現在サポートされていません。
Version をWsSQL Web サーバーのバージョンに設定します。HPCC サーバーにWsSQL サービスをインストールしておく必要があることに注意してください。本製品は、HPCC システムへの連携にWsSQL Web サービスを使います。
Cluster をターゲットクラスタに設定します。
- Alteryx Designer を開いて新しいワークフローを作成します。
- 新しいInput Data ToolをWorkflowにドラッグ&ドロップします。
- 新しい input data toolをクリックして、File or Database 下の「Database Connection -> New ODBC Connection...」を選択します。
- Alteryx用に定義下設定済みDSNを選択します。
- 開かれたウィザードの中で、クエリーに含めたいフィールドを選択します。





HPCC Systems 内のデータを要件にあった内容で正確に取得しているかを確認する場合には、SQLEditor を開き、クエリーを手動で変更することができます。

クエリー定義で、Alteryx Designer 内でHPCC Systems への接続の準備ができました。

HPCC Systems に対するセルフサービス分析の実行
これで、HPCC Systems のデータプレパレーション、ブレんディング、分析を行うワークフローを作成する準備が整いました。 以下の例では、データを整理して参照します。
- workflow にデータクレンジングツールを追加し、Null テキストフィールドをブランクに置き換え、ヌル数値フィールドを0に置き換えるには、NULL を置き換えるのボックスをオンにします。また、不要な文字を削除するにチェックを入れて先頭と末尾の空白を削除することもできます。
- workflow にbrowse data tool を追加します。
- run the workflow (CTRL+R) をクリック。
- 結果ビューにてクレンジングされたHPCC Systems データを確認します。


