本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →SQL Server のPolyBase は、データベーステーブルをクエリするTransact-SQL 構文を使って、外部データにクエリする仕組みです。 CData ODBC Driver for Elasticsearch を組み合わせて使うことで、SQL Server データと同じようにElasticsearch へのアクセスが可能です。 本記事では、外部データソースと外部テーブルの作成から、T-SQL クエリを使ってライブElasticsearch データへ接続を認可するところまで説明します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、PolyBase でライブElasticsearch データを送受信するための圧倒的なパフォーマンスを提供します。SQL Server からElasticsearch に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をElasticsearch に直接プッシュダウンし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作) をクライアント側で処理します。また、PolyBase を使用することで、単一のクエリを使用して分散ソースからデータをプルし、SQL Server データをElasticsearch と結合することもできます。
未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。PolyBase を使用してSQL Server に外部データソースを作成するには、System DSN を構成します。(CData Elasticsearch Sys は自動的に作成されます。)
接続するには、Server およびPort 接続プロパティを設定します。 認証には、User とPassword プロパティ、PKI (public key infrastructure)、またはその両方を設定します。 PKI を使用するには、SSLClientCert、SSLClientCertType、SSLClientCertSubject、およびSSLClientCertPassword プロパティを設定します。
本製品は、認証とTLS/SSL 暗号化にX-Pack Security を使用しています。TLS/SSL で接続するには、Server 値に'https://' を接頭します。Note: PKI を 使用するためには、TLS/SSL およびクライアント認証はX-Pack 上で有効化されていなければなりません。
接続されると、X-Pack では、設定したリルムをベースにユーザー認証およびロールの許可が実施されます。
[接続のテスト]をクリックして、DSN がElasticsearch に正しく接続できているかを確認します。[テーブル]タブに移動し、Elasticsearch のテーブル定義を確認します。
接続を構成したのち、外部データソースのマスター暗号化キーと資格情報データベースを作成する必要があります。
以下のSQL コマンドを実行して新しいマスターキー[ENCRYPTION]を作成し、外部データソースの資格情報を暗号化します。
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'password';
以下のSQL コマンドを実行してElasticsearch に接続されている外部データソースの資格情報を作成します。
Note:IDENTITY とSECRET はElasticsearch のUser プロパティとPassword プロパティに対応しています。
CREATE DATABASE SCOPED CREDENTIAL elasticsearch_creds WITH IDENTITY = 'username', SECRET = 'password';
以下のSQL コマンドを実行し、以前作成したDSN と資格情報を使用して、PolyBase でElasticsearch の外部データソースを作成します。
NoteSERVERNAME とPORT は、Elasticsearch のServer とPort の接続プロパティに対応しています。PUSHDOWN は、デフォルトでON に設定されているため、ODBC Driver は、サーバー側の処理を利用して複雑なクエリを実行できます。
CREATE EXTERNAL DATA SOURCE cdata_elasticsearch_source WITH ( LOCATION = 'odbc://SERVERNAME[:PORT]', CONNECTION_OPTIONS = 'DSN=CData Elasticsearch Sys', -- PUSHDOWN = ON | OFF, CREDENTIAL = elasticsearch_creds );
外部データソースを作成したら、CREATE EXTERNAL TABLE ステートメントを使用してSQL Server インスタンスからElasticsearch にリンクします。テーブルカラムの定義は、CData ODBC Driver for Elasticsearch によって公開されているものと一致しなければなりません。DSN Configuration Wizard の[テーブル]タブを参照し、テーブルの定義を確認できます。
以下は、Elasticsearch Orders に基づいて外部テーブルを作成するステートメントの一例です。
CREATE EXTERNAL TABLE Orders( OrderName [nvarchar](255) NULL, Freight [nvarchar](255) NULL, ... ) WITH ( LOCATION='Orders', DATA_SOURCE=cdata_elasticsearch_source );
SQL Server インスタンスでElasticsearch の外部テーブルを作成すると、ローカルデータとリモートデータを同時にクエリできるようになります。CData ODBC Driver に組み込まれているクエリ処理により、可能な限り多くのクエリ処理がElasticsearch にプッシュされることで、ローカルのリソースと計算リソースが解放されます。ODBC Driver for Elasticsearch の30日間無料トライアルをダウンロードし、SQL Server データでライブElasticsearch データを使い始めましょう。