Ready to get started?

Learn more about the CData Excel Add-In for Apache Spark or download a free trial:

Download Now

Excel データをApache Spark に移行

この記事では、Excel Add-In for Apache Spark をつかって、Excel からデータを Apache Spark に移行する方法を説明します。

CData Excel Add-In for Apache Spark を使えば、Excel から直接Apache Spark data への編集や保存が可能になります。この記事では、Excel から Apache Spark にデータを移行する方法を説明します。 Apache Spark のデータを一度Excel にエクスポートして編集・データソースの一括更新を行えるだけではなく、Excel スプレッドシートに保存されているデータを一括でApache Spark にインポートすることも可能です。 今回の記事では、Customers テーブルを使います。同じことが、CData Excel Add-In で取得できるすべてのテーブルに対して実行可能です。

接続の確立

Apache Spark への接続には、Excel Add-in をインストールしたExcel の[CDATA]タブ→[Apache Spark]アイコンをクリックします。

Set the Server, Database, User, and Password connection properties to connect to SparkSQL.

Apache Spark データの取得

Apache Spark にデータを挿入するには、まず該当するApache Spark のテーブルを取得します。これによりExcel スプレッドシートとApache Spark のテーブルが連携した状態になります。取得したテーブルに対し変更、もしくは追加した部分は文字が赤でハイライトされます。

  1. CData リボンからApache Spark ボタンをクリックします。データ選択ウィザードが表示されます。
  2. テーブルもしくはビューメニューから、Customers テーブルを選択します。
  3. [最大行数]に、取得したい最大行数を入力します。データの一括入力だけが目的の場合は1行だけを取得すれば十分です。リクエストどおりにクエリ欄にSQL クエリが表示されます。
  4. [シート名]に作成されるシートの名前を入力します。デフォルトでは、取得するテーブル名が新しいシート名になります。

Insert Rows to Apache Spark

データ取得後、既存のExcel で保存されているデータを取得したテーブルの下に追加していきます。

  1. テーブルの最終行の下の行に、他のシートを参照する式を入力します。例:=MyCustomersSheetInExcel!A1
  2. Apache Spark に挿入するセルを参照する式を入力し、セルを取得する行数分ドラグダウンします。テーブルに参照された値が表示されます。
  3. 挿入する行を選択して、CDATA リボンの[行を挿入]ボタンをクリックします。

各行の挿入が完了すると、Id の値が表示され、追加した値の文字が赤から黒に変わります。

 
 
ダウンロード