各製品の資料を入手。
詳細はこちら →Python でスマレジ のデータを変換・出力するETL 処理を作る方法
CData Python Connector とpetl モジュールを使って、スマレジ のデータを変換後にCSV ファイルに吐き出すETL 処理を実装します。
最終更新日:2023-09-23
この記事で実現できるスマレジ 連携のシナリオ
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Pythonエコシステムには多くのモジュールがあり、システム構築を素早く効率的に行うことができます。本記事では、CData Python Connector for Smaregi とpetl フレームワークを使って、スマレジ のデータにPython から接続してデータを変換、CSV に出力するETL 変換を実装してみます。
CData Python Connector は効率的なデータ処理によりスマレジ のデータ にPython から接続し、高いパフォーマンスを発揮します。スマレジ にデータをクエリする際、ドライバーはフィルタリング、集計などがサポートされている場合SQL 処理を直接スマレジ 側に行わせ、サポートされていないSQL 処理については、組み込みのSQL エンジンによりクライアント側で処理を行います(JOIN やSQL 関数など)。
必要なモジュールのインストール
pip で必要なモジュールおよびフレームワークをインストールします:
pip install petl pip install pandas
Python でスマレジ のデータをETL 処理するアプリを構築
モジュールとフレームワークをインストールしたら、ETL アプリケーションを組んでいきます。コードのスニペットは以下の通りです。フルコードは記事の末尾に付いています。
CData Connector を含むモジュールをインポートします。
import petl as etl import pandas as pd import cdata.smaregi as mod
接続文字列で接続を確立します。connect 関数を使って、CData スマレジ Connector からスマレジ への接続を行います
cnxn = mod.connect("ContractId=mycontractid;AccessToken=myaccesstoken;")
スマレジドライバーには、ContractId およびAccessToken パラメータが必要です。
- スマレジにログイン後、「設定」->「システム連携」->「スマレジAPI 設定」に移動します。
- 「API受信設定」セクションにある「受信機能を利用する」を「利用する」に変更し、「アクセストークンの生成」をクリックし、AccessToken を取得します。
- 次に必要なAPI アクセスを有効にするため、「機能設定」セクションで必要な機能を「利用する」に変更します。
ContractId: アカウントの契約ID。これは受信設定セクションでも確認できます。
AccessToken: 受信設定セクションのアクセストークン。
スマレジ をクエリするSQL 文の作成
スマレジ にはSQL でデータアクセスが可能です。Products エンティティからのデータを読み出します。
sql = "SELECT ProductName, Description FROM Products WHERE ProductId = '666666'"
スマレジ データ のETL 処理
DataFrame に格納されたクエリ結果を使って、petl でETL(抽出・変換・ロード)パイプラインを組みます。この例では、スマレジ のデータ を取得して、Description カラムでデータをソートして、CSV ファイルにデータをロードします。
table1 = etl.fromdb(cnxn,sql) table2 = etl.sort(table1,'Description') etl.tocsv(table2,'products_data.csv')
CData Python Connector for Smaregi を使えば、データベースを扱う場合と同感覚で、スマレジ のデータ を扱うことができ、petl のようなETL パッケージから直接データにアクセスが可能になります。
おわりに
スマレジ Python Connector の30日の無償トライアル をぜひダウンロードして、スマレジ のデータ への接続をPython アプリやスクリプトから簡単に作成しましょう。
フルソースコード
import petl as etl import pandas as pd import cdata.smaregi as mod cnxn = mod.connect("ContractId=mycontractid;AccessToken=myaccesstoken;") sql = "SELECT ProductName, Description FROM Products WHERE ProductId = '666666'" table1 = etl.fromdb(cnxn,sql) table2 = etl.sort(table1,'Description') etl.tocsv(table2,'products_data.csv')