製品をチェック

Databricks Data Provider の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Databricks アイコン Databricks ADO.NET Provider 相談したい

Databricks 連携のパワフルな.NET アプリケーションを素早く作成して配布。

SSAS でDatabricks データに連携するOLAP Cube を作成

Databricks データプロバイダーを利用してAnalysis Services プロジェクト内のDatabricks に接続し、アナリティックスやレポーティングなどで使えるOLAP キューブを構築します。

加藤龍彦
ウェブデベロッパー

最終更新日:2022-04-10
databricks ロゴ

CData

ado ロゴ画像
Microsoft SSAS ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

SQL Server Analysis Services (SSAS) は、意思決定支援やビジネスアナリティックスで使われる解析エンジンです。ビジネスレポートおよび、Power BI やExcel、 Reporting Services レポート、その他のデータ可視化ツールのようなクライアントアプリケーションに、エンタープライズレベルのセマンティックデータを提供します。Databricks 用のCData ADO.NET プロバイダーと合わせれば、Databricks を使って、より深く速いデータ分析のためのキューブを作成できます。

この記事では、Analysis Services プロジェクトをVisual Studio で作成し、Databricks の多次元モデルを構築および配置する方法を説明します。これには、アクセス可能なSSAS インスタンスと、ADO.NET プロバイダーのインストールが必要です。

Databricks 用のJDBC データソースの設定

まず、Visual Studio で新しい多元的なAnalysis Service とデータマイニングプロジェクトを作成します。次に、プロジェクト内でDatabricks 用のデータソースを作成します。

  1. [Solution Explorer] の[Data Source] を右クリックし、[New Data Source] を選択します。
  2. 既存または新規の接続に基づいて、データソースを作成することを選択し、[New] をクリックします。
  3. [Connection Manager] のDatabricks 用CData ADO.NET プロバイダーを選択し、必要な接続プロパティに入力後、[Next] をクリックします。

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。

    Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    • Database:Databricks データベース名に設定。
    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • Token:個人用アクセストークンに設定(この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます)。

    接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    Setting the Connection properties (Salesforce is shown.)
  4. インパーソネーションを[Inherit] に設定し、[Next] をクリックします。 Setting the impersonation method.
  5. データソースに名称(CData Databricks Source) を入力し、[Finish] をクリックします。

データソースビューの作成

データソースの次に、データソースビューを作成します。

  1. [Solution Explorer] で[Data Source Views] を右クリックし、[New Data Source View] を選択します。
  2. 先ほど作成したデータソース(CData Databricks Source) を選択し、[Next] をクリックします。
  3. 基になるデータソースのパターンに一致する外部キーを選択し、[Next] をクリックします。 Selecting the Foreign key match pattern.
  4. Databricks の表を選択、ビューに追加し、[Next] をクリックします。 Selecting Tables (Salesforce is shown).
  5. ビューに名前を付け、[Finish] をクリックします。

スキームに一致する外部キーに基づいて、基礎的なデータとのリレーションが検出されます。[Data Source View] をダブルクリックすることで、これらのリレーションを確認・編集することができます。

Discovered relationships in the data source view (Salesforce is shown).

[Data Source View] へのセカンダリデータソースの追加はサポートされないことに注意してください。複数のデータソースを利用する場合、SSAS は、すべてのソースがADO.NET プロバイダーでは使用できないOpenRowset 経由のリモートクエリをサポートすることを必要とします。

Databricks 用のキューブを作成する

プロジェクトを処理してDatabricks をSSAS に展開するための最後のステップはキューブの作成です。

  1. [Solution Explorer] の[Cubes] を右クリックし、[New Cube] を選択します。
  2. [Use existing tables] を選択し、[Next] をクリックします。
  3. メジャーグループテーブルに使用するテ-ブルを選択し、[Next] をクリックします。 Selecting measure group tables (Salesforce is shown).
  4. キューブに含ませたいメジャーを選択し、[Next] をクリックします。 Selecting measures (Salesforce is shown).
  5. 使用可能なテーブルに基づいて作成するディメンションを選択し、[Next] をクリックします。 Selecting dimensions (Salesforce is shown).
  6. すべての選択内容を確認し、[Finish] をクリックします。

プロジェクトを処理する

データソースと、データソースビュー、キューブを作成すると、SSASにキューブを展開する準備が完了します。ターゲットサーバーとデータベースを構成するために、プロジェクトを右クリックしプロパティを選択します。デプロイメントに移動し、ターゲットセクションでサーバーとデータベースのプロパティを設定します。

Configuring the target server and database.

ターゲットサーバーとデータベースを構成した後、プロジェクトを右クリックして[Process] を選択します。このステップの一部として、プロジェクトの構成・デプロイが必要となる場合があります。プロジェクトを構成・デプロイし、[Process Database]ウィザードにある[Run] をクリックします。

SSAS インスタンスにDatabricks 用のOLAP キューブが作成され、分析、レポート、表示の準備が完了します。Databricks 用のCData ADO.NET プロバイダーの30日の無償評価版をダウンロードして、SSAS データをご利用ください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。