Mac OS X 上のMS Excel でDatabricks データを連携利用

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Databricks ODBC Driver

Databricks ODBC Driver は、ODBC 接続をサポートする各種ツールからDatabricks へのシームレスな連携を実現します。

Databricks に使い慣れたデーたベースのように標準ODBC インターフェースでRead、Write。



iODBC でCData ODBC Driver for Databricks のDSN を作成し、Mac OS X 上のMicrosoft Excel でDatabricks に連携。

Microsoft Excel は、データの入力、集計、グラフ表示、ピボットテーブル、マクロプログラミング言語など多様な機能により、Windows、Mac マシンを問わずビジネスユーザーに愛用されているアプリケーションです。 本記事では、iODBC でのDatabricks DSN の作成方法と、Mac OS X で起動するMicrosoft Excel からのDatabricksの連携利用について説明します。

Mac OS X へのCData ODBC Drivers のインストール

CData ODBC Driver for Databricks は、iODBC Driver マネージャに事前設定されているので、簡単に多くのツールから簡単に使うことができます。

iODBC のDSN の作成

ODBC Driver for Databricks をインストールすると、iODBC Driver マネージャに登録されます。iODBC Administrator でDSN の接続プロパティを入力する必要があります。 ドライバーのインストールで自動的にシステムDSN が作成されます。システムDSN はすべてのユーザーからアクセスできます。一方、ユーザーDSN はそのユーザーからしかアクセスできません。 ただし、システムDSN の設定には権限が必要です。

  1. ターミナルを開き、次のコマンドを入力して正しい権限でAdministrator を開きます: sudo /Applications/iODBC/iODBC\ Administrator.app/Contents/MacOS/iODBC\ Administrator
  2. System タブでCData Databricks データソースを開きます。
  3. Add ボタンをクリックし、key-value ペアの形で接続プロパティを入力します。

To connect to a Databricks cluster, set the properties as described below.

Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

  • Server: Set to the Server Hostname of your Databricks cluster.
  • HTTPPath: Set to the HTTP Path of your Databricks cluster.
  • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

OAuth での認証の場合、OAuth フローが正しく実行されるためにDSN に追加でkey-value ペアを入力します:

Keyword  Value
OtherCheckPromptMode=False

Microsoft Excel からDatabricks データにアクセス

上のステップで設定されたDSN を使って、Microsoft Excel からDatabricks データにアクセスができます。

  1. Microsoft Excel を開き、スプレッドシートを開きます。
  2. データリボンの[データベース]から[新しいクエリ]を選択します。
  3. 上のステップで設定したユーザーもしくはシステムDSN を選択して、OK を押します。
  4. Microsoft Query ウィザードでクエリを作成します:
  5. [Return Data]をクリックして、クエリを実行して、Excel にデータを取得します。

CData ODBC Driver for Databricks を使って、簡単にExcel にDatabricks を取得することができました。データ取得ができれば、Excel のパワフルな分析、レポート、変換機能を駆使して様々な処理を行うことが可能です。