ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →Apache Spark ODBC Driver の30日間無償トライアルをダウンロード
30日間の無償トライアルへ製品の詳細
Apache Spark ODBC Driver 相談したいApache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。
標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。
こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。
Informatica は、データ転送用の強力で洗練された手段を提供します。CData ODBC Driver for SparkSQL を利用することで、Informatica の強力なデータ転送と操作機能でシームレスに統合された、業界が認めた標準ドライバーにアクセスできるようになります。このチュートリアルでは、Informatica PowerCenter でシンプルなWorkflow を作成してSpark データを抽出し、フラットファイルにロードする方法について説明します。
CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。
CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Informatica PowerCenter 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。
まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをPowerCenter サーバーとクライアントマシーンにドライバーをインストールします。30日間無償で、製品版の全機能が使用できます。
どちらにおいても、データソースのODBC DSN で接続プロパティを指定します。これはドライバーインストール時の最後の手順にあたります。Microsoft ODBC データソースアドミニストレーターを使ってODBC DSN を作成および設定できます。
SparkSQL への接続を確立するには以下を指定します。
Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
次のステップに従ってPowerCenter でワークフローを作成し、Spark データをプルしてフラットファイルにプッシュします。
CData=PMODBC.DLL
ソース、ターゲット、マッピングを作成して保存したら、ワークフローを作成することができるようになります。
ワークフローを作成したら、PowerCenter Workflow Manager を開いてワークフローにアクセスして開始し、Spark データをフラットファイルに素早く転送できます。ODBC Driver for SparkSQL を使用して、ソースとターゲットをPowerCenter から設定することで、Informatica PowerCenter でSpark データをお好みのエレガントで強力な機能に統合することができます。
このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。
CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。