Ready to get started?

Learn more about the CData ODBC Driver for Apache Hive or download a free trial:

Download Now

Microsoft Power BI Designer でCData ODBC Driver for Hive を使ってHive につないでみた

CData ODBC Driver for Hive を使って、Hive data へのライブ接続をMicrosoft Power BI レポートに統合できます。Power BI Designer canvas 上のデータビジュアライゼーションにHive data をドラッグアンドドロップするだけです。



Microsoft Windows のODBC ビルトインサポートにより、CData ODBC Drivers はMicrosoft Power BI のようなセルフサービスアナリティクスツールへのセルフサービス統合を実現します。CData ODBC Driver for Hive はPower BI のレポートをライブHive data にリンクします。標準SQL を使ってHive data をPower BI Designer にロードできます。データ更新をスケジュールまたはオンデマンドで更新することにより、Hive data をダッシュボードからモニタできます。また、Hive data をリアルタイムで反映し分析します。この記事では、ODBC driver を使ってMicrosoft Power BI Designer でHive data ビジュアライゼーションを作成する方法について詳しく説明します。

データビジュアライゼーションの作成

Hive data に接続し、ビジュアライゼーションを作成して、[Editing]ビューで操作する方法は次のとおりです。

  1. 接続プロパティの指定がまだの場合は、データソース名(DSN)で定義された接続プロパティを指定します。

    一般的な接続文字列は次のとおりです:

    Server=127.0.0.1;Port=10000;TransportMode=BINARY;

    DSN はビルトインのMicrosoft ODBC データソースアドミニストレーターで設定できます。これはドライバーのインストールの最後の手順です。 Microsoft ODBC データソースアドミニストレーターを使ってDSN を作成および設定する方法は、ヘルプドキュメントの「はじめに」をご参照ください。

  2. Power BI Designer を起動して[Get Data]をクリックします。Power BI Designer をPowerBI.com から起動するには、[ダウンロード]ボタンをクリックしてから[Power BI Designer]をクリックします。
  3. SQL を使ってデータをインポートしたい場合は[ODBC Query]をクリックします。[Navigator]ダイアログを使って1つ以上のテーブルを視覚的にインポートしたい場合は、[ODBC Tables]をクリックします。
  4. ODBC 接続文字列を入力します。以下は、ドライバーをインストールする際に作成されたデフォルトDSN を使った接続文字列です:

    Provider=;Persist Security Info=False;DSN=CData ApacheHive Source Note:システムにインストールされているデフォルト.NET OLE DB Provider を使うには、"Provider=" を設定します。
  5. SELECT ステートメントを入力しレポートに表示したいデータを取得します。標準SQL がサポートされています。次のクエリはCustomers テーブルをインポートします: SELECT * FROM Customers
  6. データが[Query]タブに表示されます。[Report]タブでレポートの作成を開始します。ビジュアライゼーションを作成するには、[Fields]リストから[Report]ビュー上にフィールドをドラッグします。例えば、棒グラフを作成するにはCustomers テーブルからCity をクリックするだけです。Power BI Designer は適切なカラムをmeasure として選択します:

    [Home]タブのビジュアライゼーションの一つをクリックすることで、ビジュアライゼーションを変更できます。

    チャートを右クリックすることでsort オプションを変更できます。ソートするカラムの選択、およびソート順の変更オプションが表示されます。

    ハイライトおよびフィルタリングの両方を使ってデータにフォーカスできます。フィルタリングは、フォーカスされていないデータをビジュアライゼーションから外します;ハイライトはフォーカスされていないデータをぼかします。 フィールドをクリックすることでハイライトできます:

    ビューフィルタはページ内のすべてのビジュアライゼーションに適用できます。レポート編集中に[Fields]および[Filters]ペインからビューフィルタを適用できます:フィールドを選択して[Filters]にドラッグします。フィールドの値でフィルタするには、値の一つを選択します。

[Refresh]をクリックしてデータの変更点をレポートに同期します。

Hive Data レポートをPower BI にアップロード

ODBC データソースベースのレポートを、組織内のPowerBI ユーザーと共有できます。ダッシュボードまたはレポートをアップロードするには、PowerBI.com にログインして[Get Data]>[Files]をクリックし、Power BI Designer ファイルまたはExcel ワークブックにナビゲートします。これで[Reports]セクションでレポートを見たり編集したりできます。

スケジュールおよびオンデマンドで更新

Power BI Personal Gateway を使って、レポートに関連づけられたデータセットを自動的に更新できます。 オンデマンドでもデータセットを更新できます。Personal Gateway をインストールしたら、手順に従いPersonal Gateway ODBC DSN を設定します:

  1. まだの場合はPower BI にログインします。
  2. [Dataset]セクションでHive Dataset を右クリックします。
  3. [Schedule Refresh]をクリックします。
  4. データセットの[Settings]セクションで[Manage Data Sources]ノードを展開します。[ODBC]セクションで[Edit]をクリックします。
  5. [Authentication Method]メニューで[Anonymous]を選択します。Hive クレデンシャルがDSN にすでに保存されているためです。

Personal Gateway を設定したら、オンデマンド更新および更新をスケジュールできます。

更新をスケジュールするには、[Schedule Refresh]ノードを開して[Keep Your Data Up-To-Date]オプションで[Yes]を選択します。更新の間隔を指定してから[Apply]をクリックします。

オンデマンドで更新するには、[Datasets]セクションでHive dataset を右クリックし[Refresh Now]をクリックします。

 
 
ダウンロード