SSAS でDatabricks データに連携するOLAP Cube を作成

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks ADO.NET Provider

Databricks 連携のパワフルな.NET アプリケーションを素早く作成して配布。



Databricks データプロバイダーを利用してAnalysis Services プロジェクト内のDatabricks に接続し、アナリティックスやレポーティングなどで使えるOLAP キューブを構築します。

SQL Server Analysis Services (SSAS) は、意思決定支援やビジネスアナリティックスで使われる解析エンジンです。ビジネスレポートおよび、Power BI やExcel、 Reporting Services レポート、その他のデータ可視化ツールのようなクライアントアプリケーションに、エンタープライズレベルのセマンティックデータを提供します。Databricks 用のCData ADO.NET プロバイダーと合わせれば、Databricks を使って、より深く速いデータ分析のためのキューブを作成できます。

この記事では、Analysis Services プロジェクトをVisual Studio で作成し、Databricks の多次元モデルを構築および配置する方法を説明します。これには、アクセス可能なSSAS インスタンスと、ADO.NET プロバイダーのインストールが必要です。

Databricks 用のJDBC データソースの設定

まず、Visual Studio で新しい多元的なAnalysis Service とデータマイニングプロジェクトを作成します。次に、プロジェクト内でDatabricks 用のデータソースを作成します。

  1. [Solution Explorer] の[Data Source] を右クリックし、[New Data Source] を選択します。
  2. 既存または新規の接続に基づいて、データソースを作成することを選択し、[New] をクリックします。
  3. [Connection Manager] のDatabricks 用CData ADO.NET プロバイダーを選択し、必要な接続プロパティに入力後、[Next] をクリックします。

    To connect to a Databricks cluster, set the properties as described below.

    Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

    • Server: Set to the Server Hostname of your Databricks cluster.
    • HTTPPath: Set to the HTTP Path of your Databricks cluster.
    • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

    接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

  4. インパーソネーションを[Inherit] に設定し、[Next] をクリックします。
  5. データソースに名称(CData Databricks Source) を入力し、[Finish] をクリックします。

データソースビューの作成

データソースの次に、データソースビューを作成します。

  1. [Solution Explorer] で[Data Source Views] を右クリックし、[New Data Source View] を選択します。
  2. 先ほど作成したデータソース(CData Databricks Source) を選択し、[Next] をクリックします。
  3. 基になるデータソースのパターンに一致する外部キーを選択し、[Next] をクリックします。
  4. Databricks の表を選択、ビューに追加し、[Next] をクリックします。
  5. ビューに名前を付け、[Finish] をクリックします。

スキームに一致する外部キーに基づいて、基礎的なデータとのリレーションが検出されます。[Data Source View] をダブルクリックすることで、これらのリレーションを確認・編集することができます。

[Data Source View] へのセカンダリデータソースの追加はサポートされないことに注意してください。複数のデータソースを利用する場合、SSAS は、すべてのソースがADO.NET プロバイダーでは使用できないOpenRowset 経由のリモートクエリをサポートすることを必要とします。

Databricks 用のキューブを作成する

プロジェクトを処理してDatabricks をSSAS に展開するための最後のステップはキューブの作成です。

  1. [Solution Explorer] の[Cubes] を右クリックし、[New Cube] を選択します。
  2. [Use existing tables] を選択し、[Next] をクリックします。
  3. メジャーグループテーブルに使用するテ-ブルを選択し、[Next] をクリックします。
  4. キューブに含ませたいメジャーを選択し、[Next] をクリックします。
  5. 使用可能なテーブルに基づいて作成するディメンションを選択し、[Next] をクリックします。
  6. すべての選択内容を確認し、[Finish] をクリックします。

プロジェクトを処理する

データソースと、データソースビュー、キューブを作成すると、SSASにキューブを展開する準備が完了します。ターゲットサーバーとデータベースを構成するために、プロジェクトを右クリックしプロパティを選択します。デプロイメントに移動し、ターゲットセクションでサーバーとデータベースのプロパティを設定します。

ターゲットサーバーとデータベースを構成した後、プロジェクトを右クリックして[Process] を選択します。このステップの一部として、プロジェクトの構成・デプロイが必要となる場合があります。プロジェクトを構成・デプロイし、[Process Database]ウィザードにある[Run] をクリックします。

SSAS インスタンスにDatabricks 用のOLAP キューブが作成され、分析、レポート、表示の準備が完了します。Databricks 用のCData ADO.NET プロバイダーの30日間無料トライアルを開始する。