CData ODBC driver for Hive を使って、Tableau ダッシュボードにHive をデータ連携。
エンタープライズBI にHive 連携機能を追加しましょう。CData ODBC Driver for Hive を使って、Tableau Server にHive データをリアルタイム連携して、ダッシュボードを公開。企業の他のメンバーに連携レポート・ダッシュボードを共有しましょう。
この記事では、クライアントおよびサーバーでのでのDSN の設定、Hive のデータソースのTableau Server へのパブリッシュ、ワークブック全体のTableau Server へのパブリッシュまでの手順を説明します。データソースをパブリッシュすると、Tableau Server で更新可能なワークブックを新しく作成することができるようになります。
※製品について詳しい情報をご希望の方は以下からお進みください。
- Hive にほかのBI、ETL、開発ツールから接続したい:Hive データ連携ガイドおよびチュートリアルのリストへ
- Hive Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
Hive にODBC DSNとして接続を確立
Tableau Desktop でワークブックやデータソースを作成して、Tableau Server にワークブックやデータソースをパブリッシュするには、デスクトップとサーバーのそれぞれのマシンでDSN 設定を行う必要があります。両方のマシンで厳密に同じ名前のDSN を作成して接続する必要があります。以下がHive に接続するための情報です。Windows とLinux ODBC では設定に異なる点がありますので、ドキュメントを参照してください。
Apache Hive への接続を確立するには以下を指定します。
- Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
- Port:HiveServer2 インスタンスへの接続用のポートに設定。
- TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
- 本製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します
DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。
Windows
CData ODBC Driver for Hive on Windows の場合は、DSN 設定はドライバーをインストールした後に行います。ドライバーをインストール語にDSN 設定画面が開きます。マイクロソフトのODBC データソースアドミニストレータから設定を行うことも可能です。
Linux
CData ODBC Driver for Hive をLinux で利用する場合には、ドライバーのインストールでSystem DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、接続プロパティを入力することでDSN 設定を変更することができます。
/etc/odbc.ini
[CData ApacheHive Source]
Driver = CData ODBC Driver for Hive
Description = My Description
Server = 127.0.0.1
Port = 10000
TransportMode = BINARY
コンフィグレーションファイルの詳細設定については、製品ヘルプを参照してください。
Hive データソースをTableau に公開
Hive への接続を確立したら、Tableau でHive データソースをパブリッシュして、組織内のユーザーがHive データに連携するワークブックを作成して利用できるようにします。
Tableau 上でHive データソースを作成してパブリッシュする
データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData ApacheHive Sys を選択します。
ドライバーのインストール時にシステムDSN とユーザーDSN を自動的に作成してくれます。Tableau Server では、システムDSN を使用します。
- [データベース]メニューでCData を選択します。
- [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。
- [データソース]ページで、テーブルをJOIN エリアにドラッグします。
- [サーバー]メニューで[ワークブックのパブリッシュ]-> (使用するデータソース)をクリックします。
- サーバーのURL を入力します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
- Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
- Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
- Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
- 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。
これで、組織のユーザーがパブリッシュされたHive データソースのワークブックを作成して共有することができるようになりました。

ワークブックのデータ更新(リフレッシュ)
クライアントマシンであるTableau Desktop とサーバーマシンであるTableau Server システムDSN を設定すると、接続しているHive データソースをリフレッシュすることができます。Tableau Server のインターフェースで[データ]->[使用中のデータソース]->更新(Refresh)をクリックします。

Tableau Server でHive データに連携する完成したワークブックをパブリッシュする
特定の完成したワークブックを組織内で共有する場合、Tableau Desktop でワークブックを作成し、直接Tableau Server にパブリッシュすることができます。
- 上記の1-5 の手順で、Hive に接続し、データを取得します。
- [サーバー]-> [サインイン]をクリックして、サーバーの接続を設定します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
- Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
- Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
- Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
- 選択されたデータに対しビジュアライズするディメンションおよびメジャー選択し、チャートやブラフでビジュアライズを行います。
- ワークブックが完成したら、[サーバー]-> [ワークブックのパブリッシュ]でTableau Server ににパブリッシュします。
- 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。
これで組織内のユーザーTableau Server のパブリッシュされたワークブックを参照することができるようになります。
