各製品の資料を入手。
詳細はこちら →製品をチェック
RapidMiner からRedshift のデータに連携
Redshift をRapidMiner Studio の標準コンポーネント及びデータソース構成ウィザードと統合します。
古川えりかコンテンツスペシャリスト
最終更新日:2022-10-29
この記事で実現できるRedshift 連携のシナリオ
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
この記事では、CData JDBC Driver for Redshift をRapidMiner のプロセスと簡単に統合する方法を示します。この記事では、CData JDBC Driver for Redshift を使用してRedshift をRapidMiner のプロセスに転送します。
RapidMiner のRedshift にJDBC Data Source として接続する
以下のステップに従ってRedshift へのJDBC 接続を確認できます。
- Redshift 用の新しいデータベースドライバーを追加します。[Connections]->[Manage Database Drivers]とクリックします。
- 表示されるウィザードで[Add]ボタンをクリックし、接続に名前を入力します。
- JDBC URL のプレフィックスを入力します。
jdbc:redshift:
- インストールディレクトリのlib サブフォルダにあるcdata.jdbc.redshift.jar ファイルにパスを入力して下さい。
- ドライバークラスを入力します。
cdata.jdbc.redshift.RedshiftDriver
- 新しいRedshift 接続を作成します。[Connections]->[Manage Database Connections]とクリックします。
- 接続の名前を入力します。
- データベースシステムの場合は、以前構成したRedshift ドライバーを選択します。
- Host ボックスで接続文字列を入力します。
Redshift への接続には次を設定します:
- Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
- Port: クラスタのポート。
- Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
- User: ユーザー名。
- Password: ユーザーのパスワード。
Server およびPort の値はAWS の管理コンソールで取得可能です:
- Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
- Clusters ページで、クラスタ名をクリック。
- クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。
ビルトイン接続文字列デザイナ
JDBC URL の構成については、Redshift JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.redshift.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
以下は一般的な接続文字列です。
User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;
- 必要であればユーザー名とパスワードを入力します。
プロセス内の様々なRapidMiner オペレーターとのRedshift 接続を使用できます。Redshift を取得するには、[Operators]ビューから[Retrieve]をドラッグします。
[Retrieve]オペレータを選択した状態で、[repository entry]の横にあるフォルダアイコンをクリックして[Parameters]ビューで取得するテーブルを定義できます。表示されるRepository ブラウザで接続ノードを展開し、目的のサンプルセットを選択できます。
最後に、[Retrieve]プロセスから結果に出力をワイヤリングし、プロセスを実行してRedshift を確認します。