HDFS データをTableau Desktop でビジュアライズ

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS Tableau Connector

The fastest and easiest way to connect Tableau to HDFS data. Includes comprehensive high-performance data access, real-time integration, extensive metadata discovery, and robust SQL-92 support.



CData Tableau Connector for HDFS を使ってHDFS データをTableau Desktop でビジュアライズ。

Tableau は、企業のデータ活用による問題解決の方法を変革させるビジュアルアナリティクスプラットフォームです。Tableau にCData Tableau Connector for HDFS を組み合わせて使うことで、Tableau からシームレスにHDFS データを連携利用することができるようになります。この記事では、Tableau Desktop でHDFS データに接続してシンプルなチャートを作る方法を説明します。

CData Tableau Connectors は、Tableau でリアルタイムHDFS データへのハイスピードなデータアクセスを可能にします。 Connector をインストールして、HDFS への認証を行うだけで、すぐにレスポンシブで動的なビジュアライズやダッシュボードを作成しはじめられます。 Tabelau では、HDFS データがネイティブデータタイプでアクセス可能になり、複雑なフィルタリング、集計、他の処理を自動的に行います。

NOTE: CData Tableau Connectors の日本語版は、Tableau 2020.4 以降のバージョンで使用可能です。それより前のTableau バージョンではCData ODBC Driver for HDFS もしくは、CData JDBC Driver for HDFS を使ってHDFS に接続することができます。2020.4 より前のTableau Online からHDFS に接続するには、CData Connect を使って連携できます。

Tableau Desktop でHDFS データを連携利用する

Tableau を開き「接続」 -> 「サーバーへ」-> 「その他」とクリックし、「CData によるHDFS」をクリックします。
接続画面が開くので、接続プロパティを設定して「サインイン」をクリックして接続を確立します。

In order to authenticate, set the following connection properties:

  • Host: Set this value to the host of your HDFS installation.
  • Port: Set this value to the port of your HDFS installation. Default port: 50070

Connection String での設定の場合には、スタートメニューのConnection Builder をクリック、もしくはインストールディレクトリのlib フォルダの.jar ファイルをダブルクリックしてConnection Builder を開き、プロパティを設定をすることでConnection String を取得することができます。「接続テスト」をクリックして、接続を確認します。Builder の「接続文字列」に表示された文字列をコピーしてTableau の接続画面のConnection String に貼り付けて「サインイン」をクリックして接続します。

スキーマの検出から使用データのDiscover Schemas and Query Data

  1. 「Database」のプルダウンメニューが表示された場合にはCData もしくは表示されたデータベース名で使用するものを選択します。
  2. 「Schema」のプルダウンメニューが表示された場合にはHDFS もしくは表示されたスキーマ名を選択します。
  3. 左ペインの「Table」にHDFS で使用可能なテーブルが表示されます。ビジュアライズで使うテーブルをデータセット作成エリアにドラッグ&ドロップします。複数のテーブルを選択してドロップすることが可能です。複数のテーブルを選択して、リレーションを設定することが可能です。
  4. 右上の接続モード選択で、「ライブ」もしくは「抽出」を選択します。
  5. 「今すぐ更新」もしくは「自動更新」 をクリックします。「今すぐ更新」では、はじめの10,000行を取得します。取得する行数は個別に行ボックスで設定可能です。「自動更新」ではプレビューエリアのデータが自動的に更新されます。
  6. 「ワークシート」タブをクリックします。選択したデータのカラムがデータ型によりディメンションかメジャーとしてリスト表示されています。CData Tableau Connector は、自動的にデータ型を検出してくれるので、このようにすぐにデータをビジュアライズで使うことができます。
  7. 「ディメンション」 もしくは 「メジャー」「列」 もしくは 「行」 にドラッグ&ドロップします。
  8. 「表示形式」 タブから、お好みのグラフタイプを選択します。Tableau がデータを選択したグラフタイプで表示します。

このように、CData Tableau Connector for HDFS を使うことで、Tableau で簡単にHDFS データを扱うことができます。是非、30日の無償トライアル を使って、パワフルかつシンプルなデータ連携を体感してください。