製品をチェック

製品の詳細・30日間の無償トライアルはコチラ

CData Connect

Tableau Cloud でAzure Data Lake Storage データを参照する3つの方法

ODBC Driver、Connect Cloud、Sync を通したTableau Cloud とAzure Data Lake Storage の連携について、それぞれの特徴を解説します。

加藤龍彦
ウェブデベロッパー

最終更新日:2021-09-27

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

弊社に頻繁に寄せられるご相談として、「Tableau Cloud からAzure Data Lake Storage のデータを参照したい」というシナリオがあります。CData 製品を使えば、いろいろな方法でTableau Cloud からのAzure Data Lake Storage データ参照を実現できます。API を書く必要はありません。

とはいえ実装方法毎に特徴がありますので、この記事では3種類の実装方法とその特徴をご紹介します。


Tableau Cloud との3つのデータ連携方法

プランA:Azure Data Lake Storage ODBC Driver

CData Driver でAzure Data Lake Storage データをTableau から利用

こちらは、Tableau Cloud に1台のデスクトップからパブリッシュする方法です。Tableau Desktop からTableau Cloud へのデータ更新は手動でのパブリッシュ、またはTableau Bridge を使って、定期的に自動で最新のAzure Data Lake Storage データをTableau Cloud 側にリフレッシュすることも可能です。

必要なライセンスはAzure Data Lake Storage ODBC Driver Server License です。他の方法に比べ安価に済む点がメリットです。 デメリットは、Tableau Desktop から手動でAzure Data Lake Storage データのリフレッシュをするか、Tableau Bridge を実行するマシンを常時起動する必要がある点です。また、Azure Data Lake Storage のデータがAPI リミットを超える場合には全データを取り込むことができません。

プランB:CData Connect Cloud

CData Connect Cloud を使って、Tableau Cloud からAzure Data Lake Storage に直接連携

こちらは、Tableau Cloud で直接Azure Data Lake Storage データを扱う方法です。サービス間にCData Connect Cloud という弊社のデータハブサービスが入ります。こちらはTableau Cloud から最新のAzure Data Lake Storage データへのリフレッシュが可能です。

必要なライセンスは、CData Connect Cloud Standard Edition です。メリットは、間にデスクトップやサーバーの構築が不要で、価格も安価な点です。また、Tableau Cloud 側から常に最新のAzure Data Lake Storage データが取得できます。 デメリットは、Azure Data Lake Storage のデータがAPI リミットより多い場合には全データを取り込むことができない点。

プランC:CData Sync

CData Sync でAzure Data Lake Storage データをクラウドDB に保存してTableau Cloud から参照

こちらは、Tableau Cloud がアクセス可能なDB に一度Azure Data Lake Storage データをレプリケーションする方法です。CData Sync を使って、間にクラウドDB(Amazon RDS やAmazon Redshift など)にAzure Data Lake Storage データを保管して、Tableau Cloud からDB を参照します。

必要なライセンスは、CData Sync Standard Edition です。メリットは、一度でAzure Data Lake Storage から取得できない(API リミットにひっかかる)ようなデータでも、差分更新でDB にコピーすることでTableau Cloud から扱える点です。 デメリットはDB へのレプリケーション間隔で1時間や15分などの設定になるので、リアルタイムデータではないという点です。また、間にDB とSync をホスティングする必要があります。シナリオとして、Azure Data Lake Storage 以外にも複数のデータソースをTableau Cloud で分析して使いたい場合には、データウェアハウス(DWH)的に一度DB に生のデータをレプリケートし、DWH 上でマスターデータの整備やビューの作成を行うことができる点も、CData Sync のメリットです。

まとめ

まとめると以下のようになります。

A: CData Azure Data Lake Storage Driver B: CData Connect Cloud C: CData Sync
方法 Tableau Desktop / Bridge でAzure Data Lake Storage データを取得し、パブリッシュ クラウドデータハブのCData Connect 経由でTableau Cloud からAzure Data Lake Storage データにアクセス 一度Azure Data Lake Storage データをDB に保存
リアルタイム × データのパブリッシュ間隔次第 × データのパブリッシュ間隔次第
API コーディング 不用 不用 不用
Tableau Cloud からのデータリフレッシュ × ×
外からのデータリフレッシュ Tableau Desktop で手動実行 or Tableau Bridge で定期実行 - CData Sync が一定間隔でDB を更新
ホスティング有無 Tableau Desktop/Bridge のホスティングが必要 不用 CData Sync およびDB のホスティングが必要
費用 お手頃 お手頃 やや高い
差分更新でのAPI リミット回避 不可。個別のSQL フィルタリングが可能。 不可。個別のSQL フィルタリングが可能。 差分更新可。

Tableau Cloud からAzure Data Lake Storage データへのアクセスを実現

このように、さまざまな方法でAPI 側の複雑な仕様を意識せずにAPI 連携をしたアプリのデータに、Tableau Cloud からアクセスできます。他にも多くのSaaS に対応するCData 製品の詳細を、以下からご覧ください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。