Ready to get started?

Learn more about the CData ODBC Driver for Apache Hive or download a free trial:

Download Now

Exploratory でHive データを連携する方法

ODBC 接続でExploratory からHive データにSQL でクエリ

CData ODBC Driver for Hive は、ODBC 経由でリアルタイムHive Data に標準SQL での利用を可能にします。 ここでは、汎用ODBC データプロバイダーとしてHive に接続し、データアナリティクスツールのExploratory (https://exploratory.io/) からHive データを連携利用する手順を説明します。
Exploratory は、多くのRDB やRedshift、BigQuery などのクラウドデータストアに対応していますが、SaaS データを分析したい場合にはCData ODBC Drivers を使うことで、API コーディング不要でデータを活用できます。今回はHive を例に説明します。

Hive Data に接続するODBC DSN を設定

ODBC Driver for Hive をダウンロードします。次にマシンにHive data に接続するODBC DSN を設定します。Exploratory からはそのODBC DSN を参照する形になります。ODBC DSN 設定の詳細については、ドキュメントを参照してください。

Set the Server, Port, TransportMode, and AuthScheme connection properties to connect to Hive.

Exploratory 上でHive のデータをセット

  • Exploratory で[コネクション]をクリックして新しいコネクションを作成します。
  • [追加]→[ODBC]の順にクリック。
  • コネクション追加画面で先ほど設定したHive ODBC のDSN を設定します。
    名前:任意
    タイプ:ODBC
    DSN:上の設定したDSN 名(CData Hive Sys)
  • コネクションテストを下の地、[追加]を押して接続を確定させます。

Exploratory でHive データをクエリし、データフレームとして保存

さあ、Exploratory からHive データを扱ってみましょう。

  • Exploratory でプロジェクトを[新規作成]します。
  • [データフレーム]の[+]印をクリックし、[データベースデータ]を選択します。
  • データベースは[ODBC]をクリック。
  • [コネクション]で先ほど設定したHive のコネクションを選択します。
  • RDB ソースの感覚でSELECT クエリでHive データをクエリします。標準SQL でフィルタリング、ソート、JOIN も可能です。
  • データセットをデータフレームとして保存します。

Exploratory でのHive データの分析

データフレームになったデータは通常のRDB データソースと同じようにExploratory で利用可能です。

このように、Exploratory から簡単にHive データを接続して利用することができました。ODBC Driver には30日間の無償版がありますので、是非お試しください。

 
 
ダウンロード