KNIME でAvro のJDBC ドライバーを有効にする

KNIME の標準データアクセスコンポーネントを使用してAvro でチャートとレポートを作成します。

加藤龍彦
ウェブデベロッパー

最終更新日:2013-07-10
avro ロゴ

CData

jdbc ロゴ画像
KNIME ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData JDBC Driver for Avro の強みの一つは、クロスプラットフォームのサポートであり、主要なBI ツールとの統合を可能にします。以下のステップに従って、KNIME のAvro にアクセスし、レポートデザイナを使用してAvro からチャートを作成します。

CData JDBC Driver for Avro を使用することで、JDBC データソースとしてAvro にアクセスでき、IDE の迅速な開発ツールとの統合が可能になります。この記事では、データソース構成ウィザードを使用してIntelliJ のAvro に接続する方法を示します。

Avro データへの新しいJDBC 接続を定義します。

  1. Report Designer 機能をインストールします。[File]->[Install KNIME Extensions]とクリックし、[Report]でフィルタリングします。
  2. 新しいワークフローで[File]->[Preferences]をクリックし、[KNIME]->[Databases]でノードを展開し cdata.jdbc.avro.jar を追加します。
  3. ドライバーJAR は、インストールディレクトリのlib サブフォルダにあります。 CData drivers added to a KNIME workflow.
  4. [Node Repository]ビューで[Database]->[Read/Write]とノードを展開し、[Database Reader]をワークフローエディターにドラッグします。 The DataReader that will load Avro データ into the workflow with a SELECT query.(QuickBooks is shown.)
  5. [Database Reader]をダブルクリックし、次のプロパティを設定します。

    • Database Driver:メニューでドライバーの名前(cdata.jdbc.avro.AvroDriver)を選択します。
    • Database URL:接続プロパティを入力します。jdbc:avro: から始まり、その後にセミコロンで区切られた接続プロパティのリストが続くJDBC URL を入力します。

      URI 接続プロパティをAvro ファイルの場所に設定して、ローカルのAvro ファイルに接続します。

      ビルトイン接続文字列デザイナ

      JDBC URL の構成については、Avro JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

      java -jar cdata.jdbc.avro.jar

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Using the built-in connection string designer to generate a JDBC URL (Salesforce is shown.)

      JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

      以下は一般的なJDBC URL です。

      jdbc:avro:URI=C:/folder/table.avroInitiateOAuth=GETANDREFRESH
    • User Name:認証に使用されるユーザー名
    • Password:認証に使用されるパスワード
    • SQL Statement:[SQL Statement]ボックスにSQL クエリを入力するか、テーブルをダブルクリックします。この記事では、チャートの作成に以下のクエリを用います。 SELECT Id, Column1 FROM SampleTable_1 WHERE Column2 = 'value_2'
  6. [Fetch Metadata]をクリックして接続を確認します。

    The SELECT statement defined in the Database Reader properties.(QuickBooks is shown.)
  7. [Database Reader]を[Data to Report]ノードに接続し、データセットを様々なデータ可視化コントロールに提供します。[Execute]をクリックし、ワークフローの上部にある[Edit Report]をクリックしてレポートデザイナパースペクティブを開きます。 A Database Reader linked to provide data to a Database Report.
  8. リアルタイムデータに基づいてレポートを作成できます。チャートを作成するには、チャートコントロールをパレットからレポートデザイナにドラッグします。表示されるウィザードでは、KNIME で使用可能なフィルタリングおよび集約コントロールを使用できます。 A Chart created with the report designer.

トラブルシューティング

次のリストは一般的なエラーを解決する方法を示しています。

  • [Row1]という重複するIdが見つかりました。:このエラーを解決するには、KNIME インストールディレクトリにあるknime.ini ファイルに-Dknime.database.fetchsize=0を追加します。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。