本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →Embulk は、大量のデータをDB、クラウドデータストア、DWH にロードできるオープンソースETL ツールです。近頃のトレンドでは、1社で複数のオンプレアプリやSaaS を使っており、データ分析にはETL/ELT ツールを使ってデータを丸ごとDB/DWH にロードしてから、分析やビジュアライズをすることが主流になっています。Embulk には、いろいろなプラグインがあり、多様なInput とOutput 処理をサポートしています。この記事では、Embulk のJDBC Input Plugin と CData Driver for AAS を使って、Azure Analysis Services のデータを簡単にDB にロードします。この例ではロード先のDB にはMySQL を使います。
embulk gem install embulk-input-jdbc
embulk gem install embulk-output-mysql
in:
type: jdbc
driver_path: C:\Program Files\CData\CData JDBC Driver for AAS 2019J\lib\cdata.jdbc.aas.jar
driver_class: cdata.jdbc.aas.AASDriver
url: jdbc:aas:URL=asazure://REGION.asazure.windows.net/server;InitiateOAuth=REFRESH
table: "Customer"
out:
type: mysql
host: localhost
database: DatabaseName
user: UserId
password: UserPassword
table: "Customer"
mode: insert
To connect to Azure Analysis Services, set the Url property to a valid server, for instance, asazure://southcentralus.asazure.windows.net/server, in addition to authenticating. Optionally, set Database to distinguish which Azure database on the server to connect to.
Azure Analysis Services uses the OAuth authentication standard. OAuth requires the authenticating user to interact with Azure Analysis Services using the browser. You can connect without setting any connection properties for your user credentials. See the Help documentation for more information.
embulk run aas-mysql.yml
ちなみに、上記の例ではテーブル名を直接指定しましたが、以下のようにSQL Queryを書いてもいいです。 Where句で作成日や修正日を指定すれば、最新のデータだけを対象にすることも可能です。
in:
type: jdbc
driver_path: C:\Program Files\CData\CData JDBC Driver for AAS 2019J\lib\cdata.jdbc.aas.jar
driver_class: cdata.jdbc.aas.AASDriver
url: jdbc:aas:URL=asazure://REGION.asazure.windows.net/server;InitiateOAuth=REFRESH
query: "SELECT Country, Education FROM Customer WHERE [RecordId] = 1"
out:
type: mysql
host: localhost
database: DatabaseName
user: UserId
password: UserPassword
table: "Customer"
mode: insert
CData JDBC Driver for AAS をEmbulk で使うことで、Azure Analysis Services コネクタとして機能し、簡単にデータを取得して同期することができました。ぜひ、30日の無償評価版をお試しください。