各製品の資料を入手。
詳細はこちら →Apache Spark でSalesforce Marketing のデータをSQL で操作する方法
CData JDBC ドライバーを使用して、Apache Spark でSalesforce Marketing にデータ連携。
最終更新日:2023-09-04
この記事で実現できるSalesforce Marketing 連携のシナリオ
こんにちは!リードエンジニアの杉本です。
Apache Spark は大規模データ処理のための高速エンジンです。CData JDBC Driver for SFMarketingCloud と組み合わせると、Spark はリアルタイムでSalesforce Marketing のデータに連携して処理ができます。本記事では、Spark シェルに接続してSalesforce Marketing をクエリする方法について解説します。
CData JDBC Driver は、最適化されたデータ処理がドライバーに組み込まれているため、リアルタイムSalesforce Marketing と対話するための高いパフォーマンスを提供します。Salesforce Marketing に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計など、サポートされているSQL操作を直接Salesforce Marketing にプッシュし、組込みSQL エンジンを使用してサポートされていない操作(SQL 関数やJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使用してSalesforce Marketing を操作して分析できます。
CData JDBC Driver for SFMarketingCloud をインストール
まずは、本記事右側のサイドバーからSFMarketingCloud JDBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。
Spark Shell を起動してSalesforce Marketing のデータに接続
- ターミナルを開き、Spark shell でCData JDBC Driver for SFMarketingCloud JAR file をjars パラメータに設定します:
$ spark-shell --jars /CData/CData JDBC Driver for SFMarketingCloud/lib/cdata.jdbc.sfmarketingcloud.jar
- Shell でJDBC URL を使ってSalesforce Marketing に接続し、SQL Context load() function でテーブルを読み込みます。
Salesforce Marketing Cloud API への認証
User およびPassword をログインクレデンシャルに設定するか、sandbox アカウントに接続する場合はsandbox ユーザーのクレデンシャルに設定します。
Salesforce Marketing Cloud API への接続
デフォルトでは、CData 製品は本番環境に接続します。Salesforce Marketing Cloud sandbox アカウントを使用するには、UseSandbox をtrue に設定します。
デフォルトのインスタンスは、Web Services API s7 です。他のインスタンスを使用する場合は、Instance を設定できます。
組み込みの接続文字列デザイナー
JDBC 接続文字列URL の作成には、Salesforce Marketing JDBC Driver にビルトインされたデザイナを使用できます。JAR ファイルをダブルクリックするか、コマンドラインでJAR ファイルを実行するとデザイナが開きます。
java -jar cdata.jdbc.sfmarketingcloud.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。
scala> val sfmarketingcloud_df = spark.sqlContext.read.format("jdbc").option("url", "jdbc:sfmarketingcloud:User=myUser;Password=myPassword;").option("dbtable","Subscriber").option("driver","cdata.jdbc.sfmarketingcloud.SFMarketingCloudDriver").load()
- 接続が完了し、データがロードされたら、テーブルスキーマが表示されます。
Salesforce Marketing をテンポラリーテーブルとして登録します:
scala> sfmarketingcloud_df.registerTable("subscriber")
-
データに対して、次のようなカスタムSQL クエリを実行します。
scala> sfmarketingcloud_df.sqlContext.sql("SELECT Id, Status FROM Subscriber WHERE EmailAddress = [email protected]").collect.foreach(println)
コンソールで、次のようなSalesforce Marketing のデータを取得できました!これでSalesforce Marketing との連携は完了です。
CData JDBC Driver for SFMarketingCloud をApache Spark で使って、Salesforce Marketing に対して、複雑かつハイパフォーマンスなクエリを実行できます。30日の無償評価版 をダウンロードしてぜひお試しください。