こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
CData Power BI Connector for ApacheKafka は、Power BI のツールおよびウイザードにシームレスに統合します。PowerBI.com へのリアルタイムデータのパブリッシュも可能です。次のステップで、Power BI Gateway を使って、自動リフレッシュ設定で、データをPower BI に公開します。
Power BI データソースとしてKafka を設定
CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでKafka への接続を設定します。
接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。CData PowerBI REST DSN を選択します。
Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してKafka データに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。
BootstrapServers およびTopic プロパティを設定して、Apache Kafka サーバーのアドレスと、対話するトピックを指定します。
認可メカニズム
- SASL Plain:User およびPassword プロパティを指定する必要があります。AuthScheme は'Plain' に設定します。
- SASL SSL:User およびPassword プロパティを指定する必要があります。AuthScheme は'Scram'
に、UseSSL はtrue に設定します。
- SSL:SSLCert およびSSLCertPassword プロパティを指定する必要があります。UseSSL はtrue に設定します。
- Kerberos:User およびPassword プロパティを指定する必要があります。AuthScheme は'Kerberos' に設定します。
サーバー証明書を信頼する必要がある場合があります。そのような場合は、必要に応じてTrustStorePath およびTrustStorePassword を指定してください。
Kafka テーブルをPower BI からクエリ
次の手順でKafka からデータをPower BI からクエリできるようにします:
-
Power BI Desktop を開き、[データ]->[データを取得]->[その他]-> CData ApacheKafka を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
- CData PowerBI Kafka を[Data Source Name]欄に入力します。データ接続モードを選択します:
インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
DirectQuery リモートデータに直接アクセスする場合。
- ナビゲーターダイアログで使用するテーブルを選択します。
[データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。
- カラムのデータ型の変更
- カラムの削除
- カラムのグルーピング
Power BI は、コネクタが取得・検出したKafka のカラム毎のデータ型をそのまま使えます。
Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Kafka からデータを取得します。
[読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。
データビジュアライゼーションを作成
データをPower BI から取得したら、レポートビューで取得したKafka フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。
チャートの右上をクリックしてソートオプションを変更することもできます。
チャートの部分のハイライトも可能です。
取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。
[更新]をクリックするとその時点でのリアルタイムデータをKafka から取得してレポートに反映させることができます。
オンプレミスデータゲートウェイでのPowerBI.com へのデータリフレッシュの設定
次の手順でPower BI オンプレミスゲートウェイ を使って、ローカルに設定したDSN のKafka データをPower BI のクラウド上から定期的にリフレッシュすることが可能です。
ゲートウェイモードの選択
まずはゲートウェイのモードを選択します。
- Gateway (個人用モード): Power BI にのみパブリッシュしてリフレッシュする場合はこちらを選択。ゲートウェイはWindows ユーザーアカウントで起動します。
- Gateway (formerly Enterprise): ほかのAzure サービスでゲートウェイが必要な場合には、こちらを選択します。また、複数のユーザーがゲートウェイにアクセスする場合にもデフォルトゲートウェイが必要です。
デフォルトゲートウェイでアクセスする場合にはシステムDSN で接続する必要があります。ユーザーDSN だと特定のアカウントのみがアクセスでき、システムDSN のようにシステム全体からアクセスすることができないためです。CData Power BI ApacheKafka system DSN は、コネクタのインストールの最後のステップで設定します。
個人用モードゲートウェイの設定
Personal モードでのゲートウェイでのパブリッシュは、カスタムコネクタにアクセスできるゲートウェイをインストールする必要があります。
- CData Power BI Connector インストーラーを実行します。ダウンロードはこちらから 可能です。
- on-premises data gateway (personal mode) オプションを選択します。
- ゲートウェイにサインインします。
- ゲートウェイ名を設定し、Recovery Key を指定します。
- コネクタセクションで、カスタムデータコネクタオプションを有効化します。.pqx ファイルが置かれたパスをオルタナティブパスとして設定することもできます。
Note: CData Power BI Connectors は、デフォルトフォルダ(Your User Home\Documents\Power BI Desktop\Custom Connectors)に.pqx ファイルをインストールします。
ゲートウェイの設定
ゲートウェイ経由のパブリッシュには、コネクタへのアクセスが可能なゲートウェイのインストールとPowerBI.com からのKafka DSN への接続が必要です。
1. ゲートウェイのセットアップ
次の手順でマシン上にゲートウェイを設定します:
- CData Power BI Connector インストーラーを起動します。Power BI Gateway のダウンロード も必要です。
- on-premises data gateway (recommended) オプションを選択します。
- ゲートウェイにサインインします。
- ゲートウェイ名を設定し、Recovery Key を指定します。
ゲートウェイがCData Power BI Connector を見に行くフォルダを指定します。この記事では C:\Users\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使います。CData Connector の.pqx ファイル(C:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\) を指定したフォルダに移します。
NOTE: 指定されたサービスアカウント(NT SERVICE\PBIEgwService) は、ゲートウェイのアクセスフォルダに指定される必要があります。必要な場合には、ゲートウェイインストーラーのサービス設定で変更ができます。
- コネクタセクションで、CData.PowerBI.ApacheKafka が表示されていることを確認します。
2. PowerBI.com からKafka データに接続する
- ゲートウェイにデータソースを追加: PowerBI.com にログインして、設定メニューから[ゲートウェイの管理]を選択して、ゲートウェイクラスターの設定を実行。
- [このゲートウェイクラスターでユーザーのクラウドデータソースを更新することを許可する]オプションをクリック。
- 適用を押して設定を保存します。
- 続いてCData Power BI Connectorをデータソースとして追加します。
- データソース設定セクションで、データソース名を入力し、データソースの種類にはCData Power BI Connector for ApacheKafka をドロップダウンから選択します。
- Data Source Name には、システムDSN 名を入力します:CData Power BI ApacheKafka。
- 設定後[すべての接続をテスト]ボタンをクリックし、[接続成功]が表示されれば、設定完了です。
PowerBI.com へのパブリッシュ
これでKafka データソースに連携してデータを更新できるレポートが発行できます。次の手順でデータセットを含むレポートをパブリッシュします。
- Power BI Desktop で、[発行]ボタンを押して、レポートをPower BI へパブリッシュします。
- PowerBI.com で、発行したワークスペースを選択します。
- [データセット]セクションで、設定したKafka データセットのオプションメニューをクリックして、[設定]をクリックします。
- [ゲートウェイ接続]セクションで、[データゲートウェイを使用する]を有効にします。状態がグリーンであることを確認し、適用を押して保存します。
- 個人用モードでのゲートウェイ理世うでは、[データソースクレデンシャル]をクリックして、サインインします。
データセットの更新(リフレッシュ)
これでPower BI サイドからレポートのデータをKafka の最新のデータに更新できるようになりました。
- データの手動更新には、[ワークスペース]-> データセット]に進み、更新ボタンをクリックします。
- スケジュール更新には、[ワークスペース]->[データセット]に進み、更新のスケジュールをクリックします。データの更新オプションを有効にして、更新頻度を設定します。
- レポートビューでは、更新を押してレポートを最新のデータに同期できます。