製品をチェック

無償トライアル:

無償トライアルへ

製品の情報と無償トライアルへ:

Apache Hive ODBC Driver

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。

データ連携でお困りですか?

お問い合わせ

Alteryx DesignerにてHive データを、データプレパレーション・データブレンディング・分析


セルフサービスデータアナリティクスのためのHive へのライブ接続のWorkflowを構築


hive ロゴ画像
odbc ロゴ画像

ODBC

Alteryx Designer ロゴ画像

Hive 用のCData ODBCドライバは、ODBC標準のHive からのライブデータへのアクセスを可能にし、使い慣れたSQL クエリで多種多様なBI、レポート、ETL ツールでHive を扱うことができます。 この記事では、セルフサービスBI、データプレパレーション、データブレンディング、アドバンスドアナリティクスを得意とするAlteryx Designer でODBC 接続を使用してHiveに接続して利用する方法を示します。

Hive データへの接続

  1. まだ行っていない場合は、データソース名(DSN)に必要な接続プロパティの値を入力します。 組み込みのMicrosoft ODBC データソースアドミニストレーターを使用してDSN を構成できます。 これは、ドライバのインストールじの最後のステップでも可能です。 Microsoft ODBC データソースアドミニストレータを使用してDSN を作成および設定する方法については、ヘルプドキュメントの「はじめに」の章を参照してください。

    Apache Hive への接続を確立するには以下を指定します。

    • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:HiveServer2 インスタンスへの接続用のポートに設定。
    • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
    • 本製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
  2. DSN設定 (Salesforce の場合)
  3. Alteryx Designer を開いて新しいワークフローを作成します。
  4. 新しいInput Data ToolをWorkflowにドラッグ&ドロップします。
  5. WorkflowへのInput Data toolの新規追加
  6. 新しい input data toolをクリックして、File or Database 下の「Database Connection -> New ODBC Connection...」を選択します。
  7. 新しいODBC接続の追加
  8. Alteryx用に定義下設定済みDSNを選択します。
  9. 設定済みDSNの選択
  10. 開かれたウィザードの中で、クエリーに含めたいフィールドを選択します。
  11. テーブルとフィールドの選択 (Salesforce の場合).

    Hive 内のデータを要件にあった内容で正確に取得しているかを確認する場合には、SQLEditor を開き、クエリーを手動で変更することができます。

    SQL Editorでのクエリーの変更.

クエリー定義で、Alteryx Designer 内でHive への接続の準備ができました。

設定されたData Input toolにてquery定義の完了.

Hive に対するセルフサービス分析の実行

これで、Hive のデータプレパレーション、ブレンディング、分析を行うワークフローを作成する準備が整いました。 以下の例では、データを整理して参照します。

  1. workflow にデータクレンジングツールを追加し、Null テキストフィールドをブランクに置き換え、ヌル数値フィールドを0に置き換えるには、NULL を置き換えるのボックスをオンにします。また、不要な文字を削除するにチェックを入れて先頭と末尾の空白を削除することもできます。
  2. 新しいData Cleansing toolの追加と設定.
  3. workflow にbrowse data tool を追加します。
  4. 新しいData Browse toolの追加
  5. run the workflow (CTRL+R) をクリック。
  6. 結果ビューにてクレンジングされたHive データを確認します。
  7. ワークフローの結果のブラウズ (Salesforce の場合)