Excel データをDatabricks に移行

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

Excel Add-In for Databricks

Databricks Excel Add-In は、Microsoft Excel からDatabricks データベースへの接続を実現する高機能なツールです。

Excel を使用して、Databricks の読み、書きを実行できます。 大量データのインポート / エクスポート Excel でのデータ分析などに最適!



この記事では、Excel Add-In for Databricks をつかって、Excel からデータを Databricks に移行する方法を説明します。

CData Excel Add-In for Databricks を使えば、Excel から直接Databricks への編集や保存が可能になります。この記事では、Excel から Databricks にデータを移行する方法を説明します。 Databricks のデータを一度Excel にエクスポートして編集・データソースの一括更新を行えるだけではなく、Excel スプレッドシートに保存されているデータを一括でDatabricks にインポートすることも可能です。 今回の記事では、Customers テーブルを使います。同じことが、CData Excel Add-In で取得できるすべてのテーブルに対して実行可能です。


接続の確立

Databricks への接続には、Excel Add-in をインストールしたExcel の[CDATA]タブ→[Databricks]アイコンをクリックします。

To connect to a Databricks cluster, set the properties as described below.

Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

  • Server: Set to the Server Hostname of your Databricks cluster.
  • HTTPPath: Set to the HTTP Path of your Databricks cluster.
  • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

Databricks データの取得

Databricks にデータを挿入するには、まず該当するDatabricks のテーブルを取得します。これによりExcel スプレッドシートとDatabricks のテーブルが連携した状態になります。取得したテーブルに対し変更、もしくは追加した部分は文字が赤でハイライトされます。

  1. CData リボンからDatabricks ボタンをクリックします。データ選択ウィザードが表示されます。
  2. テーブルもしくはビューメニューから、Customers テーブルを選択します。
  3. [最大行数]に、取得したい最大行数を入力します。データの一括入力だけが目的の場合は1行だけを取得すれば十分です。リクエストどおりにクエリ欄にSQL クエリが表示されます。
  4. [シート名]に作成されるシートの名前を入力します。デフォルトでは、取得するテーブル名が新しいシート名になります。

Databricks へのデータの挿入

データ取得後、既存のExcel で保存されているデータを取得したテーブルの下に追加していきます。

  1. テーブルの最終行の下の行に、他のシートを参照する式を入力します。例:=MyCustomersSheetInExcel!A1
  2. Databricks に挿入するセルを参照する式を入力し、セルを取得する行数分ドラグダウンします。テーブルに参照された値が表示されます。
  3. 挿入する行を選択して、CDATA リボンの[行を挿入]ボタンをクリックします。

各行の挿入が完了すると、Id の値が表示され、追加した値の文字が赤から黒に変わります。