製品

ソリューション

コネクタ

サポート

価格

企業情報

お役立ち情報

ブログ

検索お問い合わせ

製品をチェック

PayPal Driver の30日間無償トライアルをダウンロード

30日間の無償トライアルへ

製品の詳細

PayPal JDBC Driver 相談したい

PayPal のTransaction、Orders、Sales、Invoices データをJava/J2EE アプリケーションから手軽に連携を実現。

Apache Airflow でPayPal データに連携したワークフローを作る

CData JDBC Driver を使ってApache Airflow からPayPal データにアクセスして操作します。

古川えりか
コンテンツスペシャリスト
最終更新日：2022-09-07

CData

こんにちは！ドライバー周りのヘルプドキュメントを担当している古川です。

Apache Airflow を使うと、データエンジニアリングワークフローの作成、スケジューリング、および監視を行うことができます。CData JDBC Driver for PayPal と組み合わせることで、Airflow からリアルタイムPayPal データに連携できます。この記事では、Apache Airflow インスタンスからPayPal データに接続してクエリを実行し、結果をCSV ファイルに保存する方法を紹介します。

最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムPayPal データを扱う上で高いパフォーマンスを提供します。 PayPal にSQL クエリを発行すると、CData ドライバーはフィルタや集計などのPayPal 側でサポートしているSQL 操作をPayPal に直接渡し、サポートされていない操作（主にSQL 関数とJOIN 操作）は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブのデータ型を使ってPayPal データを操作および分析できます。

PayPal への接続を構成する

組み込みの接続文字列デザイナー

JDBC URL の作成の補助として、PayPal JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。


java -jar cdata.jdbc.paypal.jar

接続プロパティを入力し、接続文字列をクリップボードにコピーします。

CData 製品は、2つのPayPal API のテーブルを表示します。API は異なる認証方法を使用します。

REST API はOAuth 標準を使用します。REST API を認証するには、OAuthClientId、OAuthClientSecret、CallbackURL プロパティを設定する必要があります。
Classic API にはSignature API 認証情報が必要です。Classic API を認証するにはUsername、Password、およびSignature プロパティを設定する必要があります。

必要なAPI 資格情報の取得については、ヘルプドキュメントの「はじめに」を参照してください。

使用するAPI を選択するには、Schema プロパティをREST またはSOAP に設定します。デフォルトでは、SOAP スキーマが使われます。

テスト目的では、UseSandbox をtrue に設定してSandbox 資格情報を使用できます。

組み込みの接続文字列デザイナーを使ってJDBC URL を生成（paypal の場合）

クラスタ環境またはクラウドでJDBC ドライバーをホストするには、ライセンス（フルまたはトライアル）およびランタイムキー（RTK）が必要です。本ライセンス（またはトライアル）の取得については、こちらからお問い合わせください。

以下は、JDBC 接続で要求される必須プロパティです。

プロパティ	値
Database Connection URL	`jdbc:paypal:RTK=5246...;Schema=SOAP;Username=sandbox-facilitator_api1.test.com;Password=xyz123;Signature=zx2127;InitiateOAuth=GETANDREFRESH`
Database Driver Class Name	cdata.jdbc.paypal.PayPalDriver

Airflow でJDBC 接続を確立する

Apache Airflow インスタンスにログインします。
Airflow インスタンスのナビゲーションバーで、「Admin」にカーソルを合わせ、「Connections」をクリックします。
次の画面で「+」マークをクリックして新しい接続を作成します。
Add Connection フォームで、必要な接続プロパティを入力します。
- Connection Id：接続の名前：paypal_jdbc
- Connection Type：JDBC Connection
- Connection URL：上記のJDBC 接続URL：jdbc:paypal:RTK=5246...;Schema=SOAP;Username=sandbox-facilitator_api1.test.com;Password=xyz123;Signature=zx2127;InitiateOAuth=GETANDREFRESH
- Driver Class：cdata.jdbc.paypal.PayPalDriver
- Driver Path：PATH/TO/cdata.jdbc.paypal.jar
フォームの下にある「Test」ボタンをクリックし、新規の接続をテストします。
新規接続を保存すると、新しく表示される画面に、接続リストに新しい行が追加されたことを示す緑のバナーが表示されます。

DAG を作成する

Airflow におけるDAG は、ワークフローのプロセスを格納するエンティティであり、DAG にトリガーを設定することでワークフローを実行することができます。今回のワークフローでは、シンプルにPayPal データに対してSQL クエリを実行し、結果をCSV ファイルに格納します。

はじめに、Home ディレクトリにある「airflow」フォルダに移動します。その中に新しいディレクトリを作成し、タイトルを「dags」とします。ここに、UI に表示されるAirflow のDAG を構築するPython ファイルを格納します。

次に新しいPython ファイルを作成し、タイトルをpaypal_hook.py にします。この新規ファイル内に、次のコードを挿入します。

		import time
		from datetime import datetime
		from airflow.decorators import dag, task
		from airflow.providers.jdbc.hooks.jdbc import JdbcHook
		import pandas as pd

		# Dag の宣言
		@dag(dag_id="paypal_hook", schedule_interval="0 10 * * *", start_date=datetime(2022,2,15), catchup=False, tags=['load_csv'])
	
		# Dag となる関数を定義（取得するテーブルは必要に応じて変更してください）
		def extract_and_load():
		# Define tasks
			@task()
			def jdbc_extract():
				try:
					hook = JdbcHook(jdbc_conn_id="jdbc")
					sql = """ select * from Account """
					df = hook.get_pandas_df(sql)
					df.to_csv("/{some_file_path}/{name_of_csv}.csv",header=False, index=False, quoting=1)
					# print(df.head())
					print(df)
					tbl_dict = df.to_dict('dict')
					return tbl_dict
				except Exception as e:
					print("Data extract error: " + str(e))
            
			jdbc_extract()
    
		sf_extract_and_load = extract_and_load()

このファイルを保存し、Airflow インスタンスをリフレッシュします。DAG リストの中に、「paypal_hook」というタイトルの新しいDAG が表示されるはずです。
このDAG をクリックし、新しく表示される画面で一時停止解除スイッチをクリックして青色にし、トリガー（＝play）ボタンをクリックしてDAG を実行します。この操作で、paypal_hook.py ファイルのSQL クエリを実行し、結果をCSV としてコード内で指定したファイルパスにエクスポートします。
新規のDAG を実行後、Downloads フォルダ（またはPython スクリプト内で選択したフォルダ）を確認し、CSV ファイルが作成されていることを確認します（本ワークフローの場合はaccount.csv です）。
CSV ファイルを開くと、Apache Airflow によってPayPal データがCSV 形式で利用できるようになったことが確認できます。

詳細と無償トライアル

CData JDBC Driver for PayPal の 30日間無償トライアルをダウンロードして、Apache Airflow でリアルタイムPayPal データの操作をはじめましょう！ご不明な点があれば、サポートチームにお問い合わせください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。

無償トライアルへ

お問い合わせ

CData Software は、データアクセスおよびデータ接続ソリューションのリーディングプロバイダーです。CData の標準コネクタはあらゆるツール・ミドルウェアからのSaaS やDB データの連携を簡単にします。

お問い合わせ

製品概要

データコネクタ

ETL/ ELT ソリューション

クラウド&API 接続

OEM & カスタムドライバー開発

お問い合わせ先

製品を知る

データ分析 & BI