製品をチェック

Apache Hive ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Hive アイコン Apache Hive ODBC Driver 相談したい

Hive ODBC Driver は、ODBC 接続をサポートする任意のアプリケーションからApache Hive データに直接接続できるパワフルなツールです。

ドライバーはSQL をHiveQL にマッピングして、標準SQL-92 で直接Apache Hive にアクセスできます。

Tableau Server へのHive ダッシュボードの公開・パブリッシュ

CData ODBC Driver for ApacheHive を使って、Tableau ダッシュボードにHive をデータ連携。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-09-20

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

エンタープライズBI にHive 連携機能を追加しましょう。CData ODBC Driver for ApacheHive を使って、Tableau Server にHive データをリアルタイム連携して、ダッシュボードを公開。企業の他のメンバーに連携レポート・ダッシュボードを共有しましょう。

この記事では、クライアントおよびサーバーでのでのDSN の設定、Hive のデータソースのTableau Server へのパブリッシュ、ワークブック全体のTableau Server へのパブリッシュまでの手順を説明します。データソースをパブリッシュすると、Tableau Server で更新可能なワークブックを新しく作成することができるようになります。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Hive をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHive データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHive の接続を設定、2.Tableau Server 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHive への接続設定

まずは、本記事右側のサイドバーからApacheHive ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

Tableau Desktop でワークブックやデータソースを作成して、Tableau Server にワークブックやデータソースをパブリッシュするには、デスクトップとサーバーのそれぞれのマシンでDSN 設定を行う必要があります。両方のマシンで厳密に同じ名前のDSN を作成して接続する必要があります。以下がHive に接続するための情報です。Windows とLinux ODBC では設定に異なる点がありますので、ドキュメントを参照してください。

Apache Hive への接続を確立するには以下を指定します。

  • Server:HiveServer2 をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:HiveServer2 インスタンスへの接続用のポートに設定。
  • TransportMode:Hive サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
  • CData 製品においてTLS/SSL を有効化するには、UseSSL をTrue に設定します

DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

Windows

CData ODBC Driver for ApacheHive on Windows の場合は、DSN 設定はドライバーをインストールした後に行います。ドライバーをインストール語にDSN 設定画面が開きます。マイクロソフトのODBC データソースアドミニストレータから設定を行うことも可能です。

Linux

CData ODBC Driver for ApacheHive をLinux で利用する場合には、ドライバーのインストールでSystem DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、接続プロパティを入力することでDSN 設定を変更することができます。

/etc/odbc.ini

[CData ApacheHive Source] Driver = CData ODBC Driver for ApacheHive Description = My Description Server = 127.0.0.1 Port = 10000 TransportMode = BINARY

コンフィグレーションファイルの詳細設定については、製品ヘルプを参照してください。

Hive データソースをTableau に公開

Hive への接続を確立したら、Tableau でHive データソースをパブリッシュして、組織内のユーザーがHive データに連携するワークブックを作成して利用できるようにします。

Tableau 上でHive データソースを作成してパブリッシュする

  1. データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData ApacheHive Sys を選択します。

    ドライバーのインストール時にシステムDSN とユーザーDSN を自動的に作成してくれます。Tableau Server では、システムDSN を使用します。

    Tableau からDSN への接続 (Salesforce is shown.)
  2. [データベース]メニューでCData を選択します。
  3. [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。
  4. [データソース]ページで、テーブルをJOIN エリアにドラッグします。 使用するテーブルの選択(Salesforce is shown.)
  5. [サーバー]メニューで[ワークブックのパブリッシュ]-> (使用するデータソース)をクリックします。
  6. サーバーのURL を入力します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  7. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで、組織のユーザーがパブリッシュされたHive データソースのワークブックを作成して共有することができるようになりました。

Tabelau Server でデータソースへの接続を設定 (Salesforce is shown.)

ワークブックのデータ更新(リフレッシュ)

クライアントマシンであるTableau Desktop とサーバーマシンであるTableau Server システムDSN を設定すると、接続しているHive データソースをリフレッシュすることができます。Tableau Server のインターフェースで[データ]->[使用中のデータソース]->更新(Refresh)をクリックします。

Tableau Desktop からオンデマンドで更新データを取得。 (Salesforce is shown.)

Tableau Server でHive データに連携する完成したワークブックをパブリッシュする

特定の完成したワークブックを組織内で共有する場合、Tableau Desktop でワークブックを作成し、直接Tableau Server にパブリッシュすることができます。

  1. 上記の1-5 の手順で、Hive に接続し、データを取得します。 テーブルデータの取得 (Salesforce is shown.)
  2. [サーバー]-> [サインイン]をクリックして、サーバーの接続を設定します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  3. 選択されたデータに対しビジュアライズするディメンションおよびメジャー選択し、チャートやブラフでビジュアライズを行います。
  4. ワークブックが完成したら、[サーバー]-> [ワークブックのパブリッシュ]でTableau Server ににパブリッシュします。
  5. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで組織内のユーザーTableau Server のパブリッシュされたワークブックを参照することができるようになります。

Tableau Server ワークブックをパブリッシュ。 (Salesforce is shown.)

Hive からTableau Server へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。