SAP Lumira でSpark のOData Feeds を取り込み

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData API Server



API Server を使用してSAP Lumira での変更を反映するSpark フィードのデータビジュアライゼーションを作成します。

CData API サーバーおよびADO.NET Provider for Spark (または240+ の他のADO.NET Providers) を使って、SAP Lumira でSpark に基づくビジュアライゼーションを作成できます。API サーバーにより、ライブデータへの接続が可能になります。ダッシュボードとレポートはオンデマンドで更新できます。この記事では、常に最新であるグラフを作成する方法を説明します。

API サーバーをセットアップ

以下のステップに従って、安全なSpark OData サービスの作成を開始します。

デプロイ

API サーバーは独自のサーバーで実行されます。Windows では、スタンドアロンサーバーまたはIIS を使用して展開できます。Java サーブレットコンテナで、API Server WAR ファイルをドロップします。詳細とハウツーについては、ヘルプドキュメントを参照してください。

API Server は、Microsoft AzureAmazon EC2Heroku にも簡単にデプロイできます。

Spark に接続

API サーバーとADO.NET Provider for Spark を展開した後、[Settings]->[Connection]をクリックし、API サーバーコンソールで新しい接続を追加してSpark に接続するために必要な認証値とその他の接続プロパティを指定します。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:個人用アクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

次に、[Settings]->[Resources]をクリックして、API サーバーへのアクセスを許可するSpark エンティティを選択できます。

API サーバーユーザーを承認

作成するOData サービスを決定したら、[Settings]->[Users]をクリックしてユーザーを承認します。API サーバーは、認証トークンベースの認証を使用して主要な認証スキームをサポートします。IP アドレスに基づいてアクセスを制限することもできます。デフォルトでは、ローカルマシンへの接続のみが制限されています。SSL を使用して、接続を認証及び暗号化することができます。

SAP Lumira からSpark への接続

以下のステップに従って、Spark をSAP Lumira に取得します。SQL クエリを実行するか、UI を使用できます。

  1. SAP Lumira で[File]->[New]->[Query with SQL]とクリックします。Add New Dataset ダイアログが表示されます。
  2. [Generic]セクションを展開し、[Generic OData 2.0 Connector]オプションをクリックします。
  3. [Service Root URI]ボックスに、API サーバーのOData エンドポイントを入力します。URL は次の例のようになります。 https://your-server:8032/api.rsc
  4. [User Name]と[Password]のボックスにAPI ユーザーのユーザー名と認証トークンを入力します。これらの資格情報は、HTTP 基本認証で使用されます。
  5. ツリーでエンティティを選択するか、SQL クエリを入力します。この記事では、Spark Customers エンティティをインポートします。

  6. [Connect]をクリックすると、SAP Lumira は対応するOData 要求を生成し、結果をメモリにロードします。その後、フィルタ、集計、要約関数など、SAP Lumira で使用可能な任意のデータ処理ツールを使用できます。

データのビジュアライゼーションを作成

データをインポートした後、[Visualize]ルームでデータのビジュアライゼーションを作成できます。以下のステップに従って、基本グラフを作成します。

  1. [Measures and Dimensions]ペインで、メジャーとディメンションを[Visualization Tools]ペインの[x-axis]フィールドと[y-axis]フィールドにドラッグします。SAP Lumira は、API サーバーのメタデータサービスからディメンションとメジャーを自動的に検出します。

    デフォルトでは、SUM 関数はすべてのメジャーに適用されます。メジャーの横にある歯車のアイコンをクリックしてデフォルトの要約を変更します。

  2. [Visualization Tools]ペインで、グラフの種類を選択します。
  3. [Chart Canvas]ペインで、フィルタを適用し、メジャーで並べ替え、ランキングを追加して現在のSpark でグラフを更新します。