製品情報をご覧ください

製品情報や無償評価版を製品ページにてご確認いただけます。

製品ページへ

RapidMiner からJSON データに連携

JSON をRapidMiner Studio の標準コンポーネント及びデータソース構成ウィザードと統合します。

この記事では、CData JDBC driver for JSON をRapidMiner のプロセスと簡単に統合する方法を示します。この記事では、CData JDBC driver for JSON を使用してJSON をRapidMiner のプロセスに転送します。

※製品について詳しい情報をご希望の方は以下からお進みください。

RapidMiner のJSON にJDBC Data Source として接続する

以下のステップに従ってJSON へのJDBC 接続を確認できます。

  1. JSON 用の新しいデータベースドライバーを追加します。[Connections]->[Manage Database Drivers]とクリックします。
  2. 表示されるウィザードで[Add]ボタンをクリックし、接続に名前を入力します。
  3. JDBC URL のプレフィックスを入力します。 jdbc:json:
  4. インストールディレクトリのlib サブフォルダにあるcdata.jdbc.json.jar ファイルにパスを入力して下さい。
  5. ドライバークラスを入力します。 cdata.jdbc.json.JSONDriver
  6. 新しいJSON 接続を作成します。[Connections]->[Manage Database Connections]とクリックします。
  7. 接続の名前を入力します。
  8. データベースシステムの場合は、以前構成したJSON ドライバーを選択します。
  9. Host ボックスで接続文字列を入力します。

    データソースへの認証については、ヘルプドキュメントの「はじめに」を参照してください。本製品は、JSON API を双方向データベーステーブルとして、JSON ファイルを読み取り専用ビュー(ローカル ファイル、一般的なクラウドサービスに保存されているファイル、FTP サーバー)としてモデル化します。HTTP Basic、Digest、NTLM、OAuth、FTP などの主要な認証スキームがサポートされています。詳細はヘルプドキュメントの「はじめに」を参照してください。

    URI を設定して認証値を入力したら、DataModel を設定してデータ表現とデータ構造をより厳密に一致させます。

    DataModel プロパティは、データをどのようにテーブルに表現するかを制御するプロパティで、次の基本設定を切り替えます。

    • Document(デフォルト):JSON データのトップレベルのドキュメントビューをモデル化します。本製品 は、ネストされたオブジェクト配列を集約されたJSON オブジェクトとして返します。
    • FlattenedDocuments:ネストされた配列オブジェクトと親オブジェクトを、単一テーブルに暗黙的に結合します。
    • Relational:階層データから個々の関連テーブルを返します。テーブルには、親ドキュメントにリンクする主キーと外部キーが含まれています。

    リレーショナル表現の設定についての詳細は、ヘルプドキュメントの「JSON データのモデリング」を参照してください。また、以下の例で使用されているサンプルデータも確認できます。データには人や所有する車、それらの車に行われたさまざまなメンテナンスサービスのエントリが含まれています。

    ビルトイン接続文字列デザイナ

    JDBC URL の構成については、JSON JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。

    java -jar cdata.jdbc.json.jar

    接続プロパティを入力し、接続文字列をクリップボードにコピーします。

    以下は一般的な接続文字列です。

    URI=C:\people.json;DataModel=Relational;
  10. 必要であればユーザー名とパスワードを入力します。

プロセス内の様々なRapidMiner オペレーターとのJSON 接続を使用できます。JSON を取得するには、[Operators]ビューから[Retrieve]をドラッグします。 [Retrieve]オペレータを選択した状態で、[repository entry]の横にあるフォルダアイコンをクリックして[Parameters]ビューで取得するテーブルを定義できます。表示されるRepository ブラウザで接続ノードを展開し、目的のサンプルセットを選択できます。

最後に、[Retrieve]プロセスから結果に出力をワイヤリングし、プロセスを実行してJSON を確認します。

 
 
ダウンロード