製品をチェック

CData Connect Cloud の詳細情報はこちら。無償トライアルはこちら:

  無償トライアル

データ連携でお困りですか?

お問い合わせ

Tableau Online でHive データを参照する3つの方法


ODBC Driver、Connect Cloud、Sync を通したTableau Online とHive の連携について、それぞれの特徴を解説します。


hive ロゴ画像
cloud ロゴ画像

Connect Cloud

Tableau Online ロゴ画像

弊社に頻繁に寄せられるご相談として、「Tableau Online からHive のデータを参照したい」というシナリオがあります。CData 製品を使えば、いろいろな方法でTableau Online からのHive データ参照を実現できます。API を書く必要はありません。

とはいえ実装方法毎に特徴がありますので、この記事では3種類の実装方法とその特徴をご紹介します。


Tableau Online との3つのデータ連携方法

プランA:Hive ODBC Driver

CData Driver でHive データをTableau から利用

こちらは、Tableau Online に1台のデスクトップからパブリッシュする方法です。Tableau Desktop からTableau Online へのデータ更新は手動でのパブリッシュ、またはTableau Bridge を使って、定期的に自動で最新のHive データをTableau Online 側にリフレッシュすることも可能です。

必要なライセンスはHive ODBC Driver Server License です。他の方法に比べ安価に済む点がメリットです。 デメリットは、Tableau Desktop から手動でHive データのリフレッシュをするか、Tableau Bridge を実行するマシンを常時起動する必要がある点です。また、Hive のデータがAPI リミットを超える場合には全データを取り込むことができません。

プランB:CData Connect Cloud

CData Connect Cloud を使って、Tableau Online からHive に直接連携

こちらは、Tableau Online で直接Hive データを扱う方法です。サービス間にCData Connect Cloud という弊社のデータハブサービスが入ります。こちらはTableau Online から最新のHive データへのリフレッシュが可能です。

必要なライセンスは、CData Connect Cloud Standard Edition です。メリットは、間にデスクトップやサーバーの構築が不要で、価格も安価な点です。また、Tableau Online 側から常に最新のHive データが取得できます。 デメリットは、Hive のデータがAPI リミットより多い場合には全データを取り込むことができない点。

プランC:CData Sync

CData Sync でHive データをクラウドDB に保存してTableau Online から参照

こちらは、Tableau Online がアクセス可能なDB に一度Hive データをレプリケーションする方法です。CData Sync を使って、間にクラウドDB(Amazon RDS やAmazon Redshift など)にHive データを保管して、Tableau Online からDB を参照します。

必要なライセンスは、CData Sync Standard Edition です。メリットは、一度でHive から取得できない(API リミットにひっかかる)ようなデータでも、差分更新でDB にコピーすることでTableau Online から扱える点です。 デメリットはDB へのレプリケーション間隔で1時間や15分などの設定になるので、リアルタイムデータではないという点です。また、間にDB とSync をホスティングする必要があります。シナリオとして、Hive 以外にも複数のデータソースをTableau Online で分析して使いたい場合には、データウェアハウス(DWH)的に一度DB に生のデータをレプリケートし、DWH 上でマスターデータの整備やビューの作成を行うことができる点も、CData Sync のメリットです。

まとめ

まとめると以下のようになります。

A: CData Hive Driver B: CData Connect Cloud C: CData Sync
方法 Tableau Desktop / Bridge でHive データを取得し、パブリッシュ クラウドデータハブのCData Connect 経由でTableau Online からHive データにアクセス 一度Hive データをDB に保存
リアルタイム × データのパブリッシュ間隔次第 × データのパブリッシュ間隔次第
API コーディング 不用 不用 不用
Tableau Online からのデータリフレッシュ × ×
外からのデータリフレッシュ Tableau Desktop で手動実行 or Tableau Bridge で定期実行 - CData Sync が一定間隔でDB を更新
ホスティング有無 Tableau Desktop/Bridge のホスティングが必要 不用 CData Sync およびDB のホスティングが必要
費用 お手頃 お手頃 やや高い
差分更新でのAPI リミット回避 不可。個別のSQL フィルタリングが可能。 不可。個別のSQL フィルタリングが可能。 差分更新可。

Tableau Online からHive データへのアクセスを実現

このように、さまざまな方法でAPI 側の複雑な仕様を意識せずにAPI 連携をしたアプリのデータに、Tableau Online からアクセスできます。他にも多くのSaaS に対応するCData 製品の詳細を、以下からご覧ください。