Exploratory でRedshift のデータを連携する方法

ODBC 接続でExploratory からRedshift のデータにSQL でクエリ

桑島義行
テクニカルディレクター

最終更新日:2022-11-26

この記事で実現できるRedshift 連携のシナリオ

こんにちは!テクニカルディレクターの桑島です。

CData ODBC Driver for Redshift は、ODBC 経由でリアルタイムRedshift データ に標準SQL での利用を可能にします。 ここでは、汎用ODBC データプロバイダーとしてRedshift に接続し、データアナリティクスツールのExploratory (https://exploratory.io/) からRedshift のデータを連携利用する手順を説明します。
Exploratory は、多くのRDB やRedshift、BigQuery などのクラウドデータストアに対応していますが、SaaS データを分析したい場合にはCData ODBC ドライバを使うことで、API コーディング不要でデータを活用できます。今回はRedshift を例に説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Redshift をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにRedshift のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてRedshift の接続を設定、2.Exploratory 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとRedshift への接続設定

まずは、本記事右側のサイドバーからRedshift ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

次にマシンにRedshift のデータ に接続するODBC DSN を設定します。Exploratory からはそのODBC DSN を参照する形になります。ODBC DSN 設定の詳細については、ドキュメントを参照してください。

Redshift への接続には次を設定します:

  • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
  • Port: クラスタのポート。
  • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
  • User: ユーザー名。
  • Password: ユーザーのパスワード。

Server およびPort の値はAWS の管理コンソールで取得可能です:

  1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
  2. Clusters ページで、クラスタ名をクリック。
  3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。

    Exploratory 上でRedshift のデータをセット

    • Exploratory で[コネクション]をクリックして新しいコネクションを作成します。
    • [追加]→[ODBC]の順にクリック。
    • コネクション追加画面で先ほど設定したRedshift ODBC のDSN を設定します。
      名前:任意
      タイプ:ODBC
      DSN:上の設定したDSN 名(CData Redshift Sys)
    • Adding new connection
    • コネクションテストを下の地、[追加]を押して接続を確定させます。

    Exploratory でRedshift のデータをクエリし、データフレームとして保存

    さあ、Exploratory からRedshift のデータを扱ってみましょう。

    • Exploratory でプロジェクトを[新規作成]します。
    • [データフレーム]の[+]印をクリックし、[データベースデータ]を選択します。
    • Create new Dataframe
    • データベースは[ODBC]をクリック。
    • Select ODBC
    • [コネクション]で先ほど設定したRedshift のコネクションを選択します。
    • RDB ソースの感覚でSELECT クエリでRedshift のデータをクエリします。標準SQL でフィルタリング、ソート、JOIN も可能です。
    • Query data using standard SQL
    • データセットをデータフレームとして保存します。

    Exploratory でのRedshift のデータの分析

    データフレームになったデータは通常のRDB データソースと同じようにExploratory で利用可能です。

    Query data using standard SQL

    おわりに

    このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

    CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。