Redshift をTalend Open Studio の標準コンポーネントおよびデータソース設定ウィザードに統合。
この記事では、Talend で簡単にCData JDBC driver for Redshift をワークフローに統合してRedshift データ連携する方法を説明します。ここではCData JDBC Driver for Redshift を使ってTalend でRedshift をジョブフローに転送します。
※製品について詳しい情報をご希望の方は以下からお進みください。
- Redshift にほかのBI、ETL、開発ツールから接続したい:Redshift データ連携ガイドおよびチュートリアルのリストへ
- Redshift Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
JDBC データソースとしてTalend でRedshift に接続
下記の手順に従って、Redshift にJDBC 接続を確立します:
- Redshift を新しいデータベース接続を追加:新しく接続を追加するには、[Metadata]ノードを展開し[Db Connections]ノードを右クリックして[Create Connection]をクリックします。
- ウィザードが表示されたら、接続に名前を入力します。
次のページで、[DB Type]メニューから[Generic JDBC]を選択してJDBC URL を入力します。
Redshift への接続には次を設定します:
- Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
- Port: クラスタのポート。
- Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
- User: ユーザー名。
- Password: ユーザーのパスワード。
Server およびPort の値はAWS の管理コンソールで取得可能です:
- Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
- Clusters ページで、クラスタ名をクリック。
- クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。
以下は一般的なJDBC URL です:
jdbc:redshift:User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;
- インストールディレクトリの[lib]サブフォルダ内にあるcdata.jdbc.redshift.jar ファイルへのパスを入力します。
- 接続を右クリックして[Retrieve Schema]をクリックします。
- デフォルトオプションで[Next]をクリックしインポートしたいテーブルを選択します。
- デフォルトオプションでウィザードを終了します。
Orders テーブルをフラットファイルに出力
下記の手順に従って、Orders テーブルをフラットファイル出力コンポーネントに転送します:
- [Table Schemas]ノードで、テーブルをワークスペース内にドラッグします。
- ダイアログが表示されたら[tJDBCInput]コンポーネントを選択します。
- 次に、[tFileOutputDelimited]コンポーネントをPalette の[Business Intelligence]タブからワークスペース内にドラッグします。
- Orders tJDBCInput コンポーネントを右クリックしてベクタを出力ファイルにドラッグします。
プロジェクトを実行してデータを転送します。