製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

MicroStrategy Web でSpark ODBC Driver を使用

CData ODBC Driver を使用してMicroStrategy Web からSpark データに接続

古川えりか
コンテンツスペシャリスト

最終更新日:2022-02-16

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

MicroStrategy は、データドリブンイノベーションを可能にする分析およびモバイルプラットフォームです。MicroStrategy とCData ODBC Driver for SparkSQL を組み合わせると、MicroStrategy からデータベースと同じ感覚でリアルタイムSpark データにアクセスできるようになり、より高度なレポートと分析が行えます。この記事では、MicroStrategy Web に外部データとしてSpark を追加し、Spark データの簡単なビジュアライゼーションを作成する方法について説明します。

CData ODBC ドライバーは、ドライバーに組み込みの最適化されたデータ処理により、MicroStrategy でリアルタイムSpark データとやり取りする上で最高のパフォーマンスを提供します。MicroStrategy からSpark に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をSpark に直接プッシュし、サポートされていない操作(主にSQL 関数とJOIN 操作)は、組み込みのSQL エンジンを利用してクライアント側で処理します。ビルトインの動的メタデータクエリを使用すると、ネイティブのMicroStrategy データ型を使用してSpark データをビジュアライズおよび分析できます。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにSpark データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.MicroStrategy Web 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとSpark への接続設定

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

Spark への接続に関する情報と、Windows およびLinux 環境でのDSN の設定手順を以下で説明します。(ODBC Driver for SparkSQL は、接続されたMicroStrategy Intelligence Server をホストしているマシンにインストールする必要があります。)

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

DSN を構成する際にはMax Rows 接続プロパティも設定できます。これにより返される行数が制限されるため、レポートやビジュアライゼーションを作成するときのパフォーマンスを向上させることができます。

Windows

接続プロパティが未設定の場合は、まずODBC DSN(データソース名)で設定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。

Linux

CData ODBC Driver for SparkSQL をLinux 環境にインストールする場合、ドライバーのインストールによってDSN が事前に定義されます。DSN を変更するには、システムデータソースファイル(/etc/odbc.ini)を編集し、必要な接続プロパティを定義します。

/etc/odbc.ini

[CData SparkSQL Sys] Driver = CData ODBC Driver for SparkSQL Description = My Description Server = 127.0.0.1

これらの設定ファイルの使用方法については、オンラインのヘルプドキュメントを参照してください。

MicroStrategy Web を使用してSpark データに接続し、ビジュアライズする

MicroStrategy Developer でデータベースインスタンスを作成してプロジェクトに接続すると、MicroStrategy Web からSpark データのデータインポートを実行できます。もしくは、ODBC Driver を使用して新しいデータソースを作成することもできます。*

  1. MicroStrategy Web を開き、プロジェクトを選択します。
  2. 「Add External Data」をクリックし、「Databases」を選択して「Import Option」として「Select Tables」を選びます。
  3. 「Import from Tables」ウィザードでクリックして新しいデータソースを追加します。
    • DSN Data Source を選択します。
    • DSN プロパティを、以前構成したDSN(CData SparkSQL Sys)に設定します。
    • Version プロパティをGeneric DBMS に設定します。
    • User プロパティとPassword プロパティを設定(もしくはフィラー値を使用)します。
    • Data Source Name を設定します。
    Configuring the new Data Source
  4. データソースを作成したらカタログオプションをクリックして編集し、以下のクエリを設定して「OK」をクリックします。
    • 以下は、データソースで使用可能なテーブルを取得するためのSQL ステートメントです。
      SELECT
        CatalogName NAME_SPACE,
        TableName TAB_NAME
      FROM
        SYS_TABLES
          
    • 以下は、選択したテーブルのカラムを取得するためのSQL ステートメントです。
      SELECT DISTINCT 
        CatalogName NAME_SPACE, 
        TableName TAB_NAME, 
        ColumnName COL_NAME, 
        DataTypeName DATA_TYPE, 
        Length DATA_LEN, 
        NumericPrecision DATA_PREC, 
        NumericScale DATA_SCALE 
      FROM 
        SYS_TABLECOLUMNS 
      WHERE 
        TableName IN (#TABLE_LIST#) 
      ORDER BY
        1,2,3
          
  5. テーブルをペインにドラッグします。 Connecting to Spark data. Note:ライブ接続を作成するので、テーブル全体をインポートして、MicroStrategy 製品に固有のフィルタリングおよび集計機能を利用できます。
  6. 「Finish」をクリックして、ライブ接続するオプションを選択してクエリを保存し、新しいドシエを作成するオプションを選択します。 Save the query and create a new dossier.
  7. ビジュアライゼーションを選択して表示するフィールドを選択し、フィルタを適用してSpark データの新しいビジュアライゼーションを作成します。データ型は、動的なメタデータ検出によって自動的に検出されます。可能であれば、フィルタと集計によって生成された複雑なクエリはSpark にプッシュダウンされ、サポートされていない操作(SQL 関数とJOIN 操作を含む)は、ドライバーに組み込まれたCData SQL エンジンによってクライアント側で管理されます。 Visualize Spark データ.
  8. ドシエの設定が完了したら、「File」->「Save」とクリックします。

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。


Note:ODBC Driver を使用して接続するには、3- または 4-Tier Architecture が必要です。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。