Node.js でDatabricks を仮想MySQL データベースとしてクエリ

詳細情報をご希望ですか?

製品について詳細情報や無償トライアルをご案内します:

CData Connect



Node.js からDatabricks に対してMySQL データベースとしてクエリを実行。

CData Connect Cloud を使って、MySQL インターフェースでDatabricks をクエリすることができます。この記事では、Connect Cloud で仮想Databricks データベースを作成し、Node.js でDatabricks をクエリする連携方法を説明します。

CData Connect Cloud は、Databricks データのクラウドto クラウドのインターフェースを仮想MySQL として提供し、Node.js からRDB のようにデータをSQL でクエリすることができます。CData Connect Cloud がNode.js から発行されるSQL クエリ(フィルタリングやJOIN も可能)をパースしてDatabricks に送り、Node.js アプリ にDatabricks からのデータを返します。インテリジェントなサーバーサイドプロセスで、多様なクエリをパフォーマンス良く利用できます。

Databricks の仮想MySQL データベースを作成

CData Connect Cloud は、直観的なPoint-and-click インターフェースでデータソースへの接続およびAPI エンドポイント作成を行います。

  1. Connect Cloud にログインして、[Databases]をクリックします。
  2. 利用できるデータソースアイコンから"Databricks" を選択します。
  3. Databricks に接続するために必要なプロパティを入力します。

    To connect to a Databricks cluster, set the properties as described below.

    Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

    • Server: Set to the Server Hostname of your Databricks cluster.
    • HTTPPath: Set to the HTTP Path of your Databricks cluster.
    • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).
  4. Test Database]をクリックします。
  5. [Privileges]->[ Add]をクリックして、新しいユーザーを追加し、適切な権限を指定します。

これで、Databricks の仮想データベースが作成でき、MySQL クライアントからの連携が可能になりました。

Databricks データをNode.js からクエリ

以下のサンプルは、Node.js のMySQL モジュールからDatabricks への接続を定義し、クエリを実行します。以下の情報が必要です:

  • Host nameaddressport:Connect Cloud のインスタンス名(myinstance.cdatacloud.net)とポート(3306)です。
  • Username およびpassword:Connect Cloud で登録された権限のあるユーザーおよびそのパスワード。
  • Database name:Databricks (databricksdb) のデータベース名。

Databricks に接続して、以下のコードでクエリを実行します:

var mysql      = require('mysql');
var fs         = require('fs');
var connection = mysql.createConnection({
  host     : 'myinstance.cdatacloud.net',
  database : 'databricksdb',
  port	   :'3306',
  user     : 'admin',
  password : 'password',
  ssl      : {
    ca : fs.readFileSync('C:/certs/myCA.pem')
  }
});
connection.connect();
connection.query('SELECT * FROM Customers', function(err, rows, fields) {
  if (err) throw err;
  console.log(rows);
});

connection.end();