製品をチェック

無償トライアル:

無償トライアルへ

製品の情報と無償トライアルへ:

Databricks JDBC Driver

Databricks 連携のパワフルなJava アプリケーションを素早く作成して配布。

データ連携でお困りですか?

お問い合わせ

KNIME でDatabricks のJDBC ドライバーを有効にする


KNIME の標準データアクセスコンポーネントを使用してDatabricks でチャートとレポートを作成します。


databricks ロゴ画像
jdbc ロゴ画像

JDBC

KNIME ロゴ画像

CData JDBC Driver for Databricks の強みの一つは、クロスプラットフォームのサポートであり、主要なBI ツールとの統合を可能にします。以下のステップに従って、KNIME のDatabricks にアクセスし、レポートデザイナを使用してDatabricks からチャートを作成します。

CData JDBC Driver for Databricks を使用することで、JDBC データソースとしてDatabricks にアクセスでき、IDE の迅速な開発ツールとの統合が可能になります。この記事では、データソース構成ウィザードを使用してIntelliJ のDatabricks に接続する方法を示します。

Databricks データへの新しいJDBC 接続を定義します。

  1. Report Designer 機能をインストールします。[File]->[Install KNIME Extensions]とクリックし、[Report]でフィルタリングします。
  2. 新しいワークフローで[File]->[Preferences]をクリックし、[KNIME]->[Databases]でノードを展開し cdata.jdbc.databricks.jar を追加します。
  3. ドライバーJAR は、インストールディレクトリのlib サブフォルダにあります。 CData drivers added to a KNIME workflow.
  4. [Node Repository]ビューで[Database]->[Read/Write]とノードを展開し、[Database Reader]をワークフローエディターにドラッグします。 The DataReader that will load Databricks data into the workflow with a SELECT query.(QuickBooks is shown.)
  5. [Database Reader]をダブルクリックし、次のプロパティを設定します。

    • Database Driver:メニューでドライバーの名前(cdata.jdbc.databricks.DatabricksDriver)を選択します。
    • Database URL:接続プロパティを入力します。jdbc:databricks: から始まり、その後にセミコロンで区切られた接続プロパティのリストが続くJDBC URL を入力します。

      To connect to a Databricks cluster, set the properties as described below.

      Note: The needed values can be found in your Databricks instance by navigating to Clusters, and selecting the desired cluster, and selecting the JDBC/ODBC tab under Advanced Options.

      • Server: Set to the Server Hostname of your Databricks cluster.
      • HTTPPath: Set to the HTTP Path of your Databricks cluster.
      • Token: Set to your personal access token (this value can be obtained by navigating to the User Settings page of your Databricks instance and selecting the Access Tokens tab).

      ビルトイン接続文字列デザイナ

      JDBC URL の構成については、Databricks JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

      java -jar cdata.jdbc.databricks.jar

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

      JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

      以下は一般的なJDBC URL です。

      jdbc:databricks:Server=127.0.0.1;Port=443;TransportMode=HTTP;HTTPPath=MyHTTPPath;UseSSL=True;User=MyUser;Password=MyPassword;
    • User Name:認証に使用されるユーザー名
    • Password:認証に使用されるパスワード
    • SQL Statement:[SQL Statement]ボックスにSQL クエリを入力するか、テーブルをダブルクリックします。この記事では、チャートの作成に以下のクエリを用います。 SELECT City, CompanyName FROM Customers WHERE Country = 'US'
  6. [Fetch Metadata]をクリックして接続を確認します。

    The SELECT statement defined in the Database Reader properties.(QuickBooks is shown.)
  7. [Database Reader]を[Data to Report]ノードに接続し、データセットを様々なデータ可視化コントロールに提供します。[Execute]をクリックし、ワークフローの上部にある[Edit Report]をクリックしてレポートデザイナパースペクティブを開きます。 A Database Reader linked to provide data to a Database Report.
  8. ライブデータに基づいてレポートを作成できます。チャートを作成するには、チャートコントロールをパレットからレポートデザイナにドラッグします。表示されるウィザードでは、KNIME で使用可能なフィルタリングおよび集約コントロールを使用できます。 A Chart created with the report designer.

トラブルシューティング

次のリストは一般的なエラーを解決する方法を示しています。

  • [Row1]という重複するIdが見つかりました。:このエラーを解決するには、KNIME インストールディレクトリにあるknime.ini ファイルに-Dknime.database.fetchsize=0を追加します。