製品

ソリューション

コネクタ

サポート

価格

企業情報

お役立ち情報

ブログ

検索お問い合わせ

製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

30日間の無償トライアルへ

製品の詳細

Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

Informatica PowerCenter でSpark データを抽出、変換、ロードする

Informatica PowerCenter でSpark データのシンプルなWorkflow を作成。

古川えりか
コンテンツスペシャリスト
最終更新日：2022-04-03

こんにちは！ドライバー周りのヘルプドキュメントを担当している古川です。

Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for SparkSQL を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してSpark データを抽出し、フラットファイルにロードする方法について説明します。

CData ODBC ドライバとは？

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
多様なアプリケーション、ツールにSpark データを連携
ノーコードでの手軽な接続設定
標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとSpark への接続設定

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。

どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
Port：SparkSQL インスタンスへの接続用のポートに設定。
TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

Server：Databricks クラスターのサーバーのホスト名に設定。
Port：443
TransportMode：HTTP
HTTPPath：Databricks クラスターのHTTP パスに設定。
UseSSL：True
AuthScheme：PLAIN
User：'token' に設定。
Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。

PowerCenter でETL ワークフローを作成する

次のステップに従ってPowerCenter でワークフローを作成し、Spark データをプルしてフラットファイルにプッシュします。

ODBC ドライバーを使用してソースを作成する

%INFA_HOME%\clients\PowerCenterClient\client\bin にあるpowrmart.ini ファイルで、次の行をODBCDLL セクションに追加します。
```
CData=PMODBC.DLL
```
PowerCenter Workflow Manager で新しいODBC リレーショナル接続を追加し、ユーザー名とパスワードのプロパティをODBC Driver がインストールされているマシンのユーザーに設定して、接続文字列をドライバーのSystem DSN（CData SparkSQL Sys）に設定します。
PowerCenter Designer でリポジトリに接続し、フォルダを開きます。
「Source Analyzer」を選択してソースメニューをクリックし、「Import from Database」を選択します。
ODBC データソースのドロップダウンメニューで、以前構成したDSN（CData SparkSQL Sys）を選択します。
「connect」をクリックし、含めるテーブルとビューを選択します。
「OK」をクリックします。

ソースを使用してフラットファイルターゲットを作成する

「Targets Analyzer」を選択し、以前に作成したソースをワークスペースにドラッグアンドドロップします。既存のソースを使用することで、カラムがターゲットにコピーされます。
新しいターゲットを右クリックし、「edit」をクリックしてデータベースタイプをフラットファイルに変更します。

Spark データとフラットファイル間のマッピングを作成する

「Mapping Designer」をクリックします。
ソースとターゲットをワークスペースにドラッグします。（プロンプトが表示されたら、新しいマッピングに名前を付けます。）
ワークスペースで右クリックし、「Autolink by Name」を選択します。
カラムをソース修飾子からターゲット定義にドラッグします。
フォルダをセーブ（Ctrl + S）します。

マッピングを使用してワークフローを作成する

ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。

マッピングを右クリックして「generate workflow」を選択し、「Workflow Generation」ウィザードを開きます。
再利用不可のセッションでワークフローを作成します。
（以前作成した関連する接続への）接続オブジェクトが適切に構成されていることを確認してプレフィックスを設定します。
必要に応じて接続を設定します。
ワークフローを確認して「Finish」をクリックします。

ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Spark データをフラットファイルに素早く転送できます。ODBC Driver for SparkSQL を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でSpark データをお好みのエレガントで強力な機能に統合することができます。

Spark からInformatica PowerCenter へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。

無償トライアルへ

お問い合わせ

CData Software は、データアクセスおよびデータ接続ソリューションのリーディングプロバイダーです。CData の標準コネクタはあらゆるツール・ミドルウェアからのSaaS やDB データの連携を簡単にします。

お問い合わせ

製品概要

データコネクタ

ETL/ ELT ソリューション

クラウド&API 接続

OEM & カスタムドライバー開発

お問い合わせ先

製品を知る

データ分析 & BI