【完全ガイド】Power BI × Databricks連携 - SQLなしでDatabricksのデータを分析・可視化

SQLの知識不要!Power BIでDatabricksのデータを簡単分析。ノーコードでのデータ連携方法からBIレポート作成まで徹底解説します。

加藤龍彦
デジタルマーケティング

最終更新日:2025-03-24

この記事で実現できるDatabricks 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData Power BI Connectors は、セルフサービスBI であるMicrosoft Power BI のデータソースをDatabricks を含む270種類以上のSaaS / DB に拡充、分析や可視化を実現します。もちろん、ダッシュボードでDatabricks のデータをモニタリングしたり、定期更新やリアルタイムでのデータ更新も自在に可能。この記事では、Power BI Connector を使用してPower BI Desktop からDatabricks の可視化を作成する方法について詳しく説明します。

クラウド提供のPowerBI.com へのDatabricks レポートの発行(パブリッシュ)方法については、こちらの記事をご参照ください。

CData Power BI Connectors とは?:SQL・コーディングなしでDatabricks のデータを活用

CData Power BI Connectors は、以下の特徴を持つPower BI とのリアルタイムデータ連携ソリューションです。

  1. Databricks をはじめとする、CRM、MA、グループウェア、広告、会計ツールなど多様な270種類以上のSaaS / DB に対応
  2. ノーコードでの手軽な接続設定。SQL・コーディングは必要ありません
  3. DirectQuery に対応し、大容量データの動的な取得・更新も可能
  4. 標準SQL での柔軟なデータ読み込み

CData Power BI Connectors では、1.データソースとしてDatabricks の接続を設定、2.Power BI 側でコネクタとの接続を設定、という2ステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData Power BI Connector のインストールとDatabricks への接続設定

まずは、本記事右側のサイドバーからDatabricks Power BI Connector の無償トライアルをダウンロード・インストールしてください。30日間無料で製品版の全機能が使用できます。

Power BI のデータソースとしてDatabricks を設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでDatabricks への接続を設定します。もしDSN 設定画面が開かない場合は、手動で「ODBC データソース アドミニストレータ(DSN)」プログラムを開いてください。

DSN 内の「CData PBI Databricks」を選択します。DSN 設定画面で必要な資格情報を入力してDatabricks のデータに接続します。入力後に接続のテストを行い、OK をクリックすれば接続は完了です。埋め込みOAuth に対応したデータソースであれば、「接続テスト」をクリックするとログイン画面が立ち上がり、ログインを完了するだけで接続設定が完了します。簡単ですね!

Power BI Connector DSN接続設定画面

Databricks 接続プロパティの取得・設定方法

Databricks クラスターに接続するには、以下のプロパティを設定します。

  • Database:Databricks データベース名。
  • Server:Databricks クラスターのサーバーのホスト名
  • HTTPPath:Databricks クラスターのHTTP パス。
  • Token:個人用アクセストークン。この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます。
Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

Databricks への認証

CData は、次の認証スキームをサポートしています。

  • Basic
  • 個人用アクセストークン
  • Azure Active Directory(AD)
  • Azure サービスプリンシパル
  • OAuthU2M
  • OAuthM2M

Basic

Basic 認証には、ユーザー名とパスワードが必要です。以下を設定します。

  • AuthSchemeBasic
  • User:ユーザーネーム。これはデフォルト値("Token")をオーバーライドします。
  • Token:パスワード。

その他の認証方法については、ヘルプドキュメント の「はじめに」セクションを参照してください。

これで、Databricks のデータをPower BI に連携するための準備は完了です!いよいよPower BI からDatabricks のデータを取得していきます。

Databricks テーブルをPower BI からクエリ

それでは、実際にPower BI からDatabricks のデータを取得してみましょう。

  1. Power BI Desktop を開き、「データ」->「データを取得」->「その他」->「CData Databricks」を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
  2. CData PBI Databricks を「Data Source Name」欄に入力します。データ接続モードを選択します:
    インポート:データをプロジェクトにインポートする場合。オンデマンドで更新が可能
    DirectQueryDatabricks のデータとリアルタイムで連携する場合。
  3. ナビゲーターダイアログで使用するテーブルを選択します。選択したら、「読み込み」ボタンをクリックしてデータを取得します。 利用可能なテーブル一覧
  4. (オプション)データをそのまま読み込まず、「データの変換」を使ってデータをカスタマイズすることもできます。例えば、以下の操作が可能です。必要に応じて試してみてください。
    • カラムのデータ型の変更
    • カラムの削除
    • カラムのグルーピング

Power BI は、コネクタが取得・検出したDatabricks のカラム毎のデータ型をそのまま使えます。データ変換を取得して、指定した条件でクエリを発行し、Databricks からデータを取得します。

Databricks のデータを分析・可視化

データをPower BI で取得したら、いよいよ可視化に活用できます!レポートビューで取得したDatabricks フィールドをドラッグ&ドロップして可視化を作成していきましょう。グラフの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

Power BI を使ったDatabricksデータの可視化

「更新」をクリックすると、その時点でのリアルタイムデータをDatabricks から取得してレポートに反映させることができます。

これで、Databricks のデータのPower BI での可視化ができました!あとは可視化を追加したり、フィルタリングや集計、データ変換などPower BI のパワフルな機能を活用して分析、レポーティング、ダッシュボード構築などさまざまな用途で利用できます。

Databricks からPower BI へのデータ連携には、CData Power BI Connector をご利用ください

本記事で紹介したようにCData Power BI Connectors と併用することで、270を超えるSaaS、NoSQL、DB のデータをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData Power BI Connector は日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。製品の使用方法、購入方法などについてご質問がありました、お気軽にお問い合わせください。

よくある質問(FAQ)

Q: SQL の知識がなくてもDatabricks のデータに連携できますか?

A: はい、CData Power BI Connectorを使用することで、SQL の知識がなくてもドラッグ&ドロップで簡単にDatabricks のデータを分析できます。

Q: どのようなデータソースに接続できますか?

A: Databricksを含む270種類以上のSaaS、データベース、クラウドサービスに接続可能です。

Q: リアルタイムでのデータ更新は可能ですか?

A: はい、DirectQuery機能を使用することで、リアルタイムでのデータ更新が可能です。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。