Python のDash ライブラリを使って、Redshift のデータ に連携するウェブアプリケーションを開発する方法

CData Python Connector を使って、Redshift にデータ連携するPython ウェブアプリケーションを開発できます。pandas とDash を使って作成してみます。

加藤龍彦
デジタルマーケティング

最終更新日:2023-09-23

この記事で実現できるRedshift 連携のシナリオ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Python エコシステムには、多くのモジュールがあり、システム構築を素早く効率的に行うことができます。CData Python Connector for Redshift を使うことで、pandas モジュールとDash フレームワークでRedshift にデータ連携するアプリケーションを効率的に開発することができます。本記事では、pandas、Dash とCData Connector を使って、Redshift に連携して、Redshift のデータ をビジュアライズするシンプルなウェブアプリを作る方法をご紹介します。

CData Python Connectors の特徴

CData Python Connectors は、以下のような特徴を持った製品です。

  1. Redshift をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレデータソースに対応
  2. Dash をはじめとする多様なデータ分析・BI ツールにRedshift のデータを連携
  3. ノーコードでの手軽な接続設定

必要なモジュールのインストール

まずは、pip で必要なモジュールおよびフレームワークをインストールします:

pip install pandas
pip install dash
pip install dash-daq

Python でRedshift のデータを可視化

必要なモジュールとフレームワークがインストールされたら、ウェブアプリを開発していきます。コードのスニペットは以下の通りです。フルコードは記事の末尾に掲載しているので、参考にしてください。

まず、CData Connector を含むモジュールをインポートします:

import os
import dash
import dash_core_components as dcc
import dash_html_components as html
import pandas as pd
import cdata.redshift as mod
import plotly.graph_objs as go

接続文字列を使ってデータへの接続を確立します。connect 関数を使ってCData Redshift Connector からRedshift のデータ との接続を確立します。

cnxn = mod.connect("User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;")

Redshift への接続には次を設定します:

  • Server: 接続するデータベースをホストしているクラスタのホスト名およびIP アドレス。
  • Port: クラスタのポート。
  • Database: データベース名、ブランクの場合ユーザーのデフォルトデータベースになります。
  • User: ユーザー名。
  • Password: ユーザーのパスワード。

Server およびPort の値はAWS の管理コンソールで取得可能です:

  1. Amazon Redshift console (http://console.aws.amazon.com/redshift) を開く。
  2. Clusters ページで、クラスタ名をクリック。
  3. クラスタのConfiguration タブで、表示された接続文字列からクラスタのURL をコピーします。

    Redshift にクエリを実行

    read_sql 関数を使って、padas からSQL 文を発行し、DataFrame に結果を格納します。

    df = pd.read_sql("""SELECT ShipName, ShipCity FROM Orders WHERE ShipCountry = 'USA'""", cnxn)
    

    ウェブアプリケーションの設定

    DataFrame に格納されたクエリ結果を使って、ウェブアプリにname、stylesheet、title を設定していきます。

    app_name = 'dash-redshiftedataplot'
    
    external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']
    
    app = dash.Dash(__name__, external_stylesheets=external_stylesheets)
    app.title = 'CData + Dash'

    Layout 設定

    次に、Redshift のデータ をベースにした棒グラフを作詞し、アプリのレイアウトを設定します。

    trace = go.Bar(x=df.ShipName, y=df.ShipCity, name='ShipName')
    
    app.layout = html.Div(children=[html.H1("CData Extention + Dash", style={'textAlign': 'center'}),
    	dcc.Graph(
    		id='example-graph',
    		figure={
    			'data': [trace],
    			'layout':
    			go.Layout(alt='Redshift Orders Data', barmode='stack')
    		})
    ], className="container")
    

    アプリをセットアップして実行

    接続、アプリ、レイアウトを定義したら、アプリを実行してみましょう。以下のコードで実行できます。

    if __name__ == '__main__':
        app.run_server(debug=True)
    

    最後に、Python でウェブアプリを起動してブラウザでRedshift のデータ を見てみましょう。

    python redshift-dash.py
    
    Dash のウェブアプリでRedshift のデータ を表示

    ちゃんとデータが表示できてますね!

    おわりに

    Redshift Python Connector の30日の無償トライアル をぜひダウンロードして、Redshift のデータ への接続をPython アプリやスクリプトから簡単に作成してみてください。



    import os
    import dash
    import dash_core_components as dcc
    import dash_html_components as html
    import pandas as pd
    import cdata.redshift as mod
    import plotly.graph_objs as go
    
    cnxn = mod.connect("User=admin;Password=admin;Database=dev;Server=examplecluster.my.us-west-2.redshift.amazonaws.com;Port=5439;")
    
    df = pd.read_sql("SELECT ShipName, ShipCity FROM Orders WHERE ShipCountry = 'USA'", cnxn)
    app_name = 'dash-redshiftdataplot'
    
    external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']
    
    app = dash.Dash(__name__, external_stylesheets=external_stylesheets)
    app.title = 'CData + Dash'
    trace = go.Bar(x=df.ShipName, y=df.ShipCity, name='ShipName')
    
    app.layout = html.Div(children=[html.H1("CData Extention + Dash", style={'textAlign': 'center'}),
    	dcc.Graph(
    		id='example-graph',
    		figure={
    			'data': [trace],
    			'layout':
    			go.Layout(alt='Redshift Orders Data', barmode='stack')
    		})
    ], className="container")
    
    if __name__ == '__main__':
        app.run_server(debug=True)
    

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。