ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →30日間の無償トライアル
無償トライアルはこちら製品の詳細
AlloyDB へのデータ連携用のPython Connecotr ライブラリ。 pandas、SQLAlchemy、Dash、petl などの主要なPython ツールにAlloyDB をシームレスに統合。
古川えりか
コンテンツスペシャリスト
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Pythonエコシステムには多くのモジュールがあり、システム構築を素早く効率的に行うことができます。本記事では、CData Python Connector for AlloyDB とpetl フレームワークを使って、AlloyDB データにPython から接続してデータを変換、CSV に出力するETL 変換を実装してみます。
CData Python Connector は効率的なデータ処理によりAlloyDB データ にPython から接続し、高いパフォーマンスを発揮します。AlloyDB にデータをクエリする際、ドライバーはフィルタリング、集計などがサポートされている場合SQL 処理を直接AlloyDB 側に行わせ、サポートされていないSQL 処理については、組み込みのSQL エンジンによりクライアント側で処理を行います(JOIN やSQL 関数など)。
RDB と同感覚でAlloyDB データへの連携を行うことができます。必要な接続プロパティを使って接続文字列を作成します。本記事では、接続文字列をcreate_engine 関数のパラメータとして送ります。
AlloyDB に接続するには、次の接続プロパティが必要です。
標準認証で接続する場合は、これ以上のアクションは必要ありません。
本製品がサポートしている他の認証方法では、AlloyDB サーバー上のpg_hba.conf ファイルで有効化する必要があります。
AlloyDB サーバーでの認証の設定については、こちらを参照してください。
MD5
pg_hba.conf ファイルのauth-method をmd5 に設定すると、MD5 パスワード検証を使用して認証できます。
SASL
本製品は、SASL(特にSCRAM-SHA-256)でパスワードを検証することで認証できます。
この認証方法を使用するには、pg_hba.conf ファイルのauth-method をscram-sha-256 に設定します。
Kerberos 認証は、本製品が接続を試行している際にAlloyDB サーバーで開始されます。この認証方法を有効化するには、AlloyDB サーバーでKerberos を設定します。AlloyDB サーバーでのKerberos 認証の設定を完了したら、本製品からKerberos 認証を行う方法については、ヘルプドキュメントの「Kerberos の使用」セクションを参照してください。
CData AlloyDB Connector をインストールしたら、次のように必要なモジュールをインストールし、Python オブジェクトでAlloyDB にアクセスします。
pip で必要なモジュールおよびフレームワークをインストールします:
pip install petl pip install pandas
モジュールとフレームワークをインストールしたら、ETL アプリケーションを組んでいきます。コードのスニペットは以下の通りです。フルコードは記事の末尾に付いています。
CData Connector を含むモジュールをインポートします:
import petl as etl import pandas as pd import cdata.alloydb as mod
接続文字列で接続を確立します。connect 関数を使って、CData AlloyDB Connector からAlloyDB への接続を行います
cnxn = mod.connect("User=alloydb;Password=admin;Database=alloydb;Server=127.0.0.1;Port=5432")
AlloyDB にはSQL でデータアクセスが可能です。Orders エンティティからのデータを読み出します。
sql = "SELECT ShipName, ShipCity FROM Orders WHERE ShipCountry = 'USA'"
DataFrame に格納されたクエリ結果を使って、petl でExtract(取得)、Transform(加工)、Load(ロード)を組みます。この例では、AlloyDB データ を取得して、ShipCity カラムでデータをソートして、CSV ファイルにデータをロードします。
table1 = etl.fromdb(cnxn,sql) table2 = etl.sort(table1,'ShipCity') etl.tocsv(table2,'orders_data.csv')
CData Python Connector for AlloyDB を使えば、データベースを扱う場合と同感覚で、AlloyDB データ を扱うことができ、petl のようなETL パッケージから直接データにアクセスが可能になります。
AlloyDB Python Connector の30日の無償トライアル をぜひダウンロードして、AlloyDB データ への接続をPython アプリやスクリプトから簡単に作成しましょう。
import petl as etl import pandas as pd import cdata.alloydb as mod cnxn = mod.connect("User=alloydb;Password=admin;Database=alloydb;Server=127.0.0.1;Port=5432") sql = "SELECT ShipName, ShipCity FROM Orders WHERE ShipCountry = 'USA'" table1 = etl.fromdb(cnxn,sql) table2 = etl.sort(table1,'ShipCity') etl.tocsv(table2,'orders_data.csv')