製品をチェック

Azure Data Lake Storage ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage ODBC Driver 相談したい

Azure Data Lake Storage ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからAzure Data Lake Storage にデータ連携。

Azure Data Lake Storage にデータベースと同感覚でアクセスして、Azure Data Lake Storage データに使い慣れたODBC インターフェースで連携。

Exploratory でAzure Data Lake Storage データを連携する方法

ODBC 接続でExploratory からAzure Data Lake Storage データにSQL でクエリ

桑島義行
テクニカルディレクター

最終更新日:2022-11-26
azuredatalake ロゴ

CData

odbc ロゴ画像
Exploratory ロゴ

こんにちは!テクニカルディレクターの桑島です。

CData ODBC Driver for ADLS は、ODBC 経由でリアルタイムAzure Data Lake Storage データ に標準SQL での利用を可能にします。 ここでは、汎用ODBC データプロバイダーとしてAzure Data Lake Storage に接続し、データアナリティクスツールのExploratory (https://exploratory.io/) からAzure Data Lake Storage データを連携利用する手順を説明します。
Exploratory は、多くのRDB やRedshift、BigQuery などのクラウドデータストアに対応していますが、SaaS データを分析したい場合にはCData ODBC ドライバを使うことで、API コーディング不要でデータを活用できます。今回はAzure Data Lake Storage を例に説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Azure Data Lake Storage をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにAzure Data Lake Storage データを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてAzure Data Lake Storage の接続を設定、2.Exploratory 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとAzure Data Lake Storage への接続設定

まずは、本記事右側のサイドバーからADLS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

次にマシンにAzure Data Lake Storage データ に接続するODBC DSN を設定します。Exploratory からはそのODBC DSN を参照する形になります。ODBC DSN 設定の詳細については、ドキュメントを参照してください。

Azure DataLakeStorage 接続プロパティの取得・設定方法

Azure DataLakeStorage Gen 1 への接続

Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

  • SchemaADLSGen1 を指定。
  • Account:アカウント名に設定。
  • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
  • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

Azure DataLakeStorage Gen 1 への認証

Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

Azure DataLakeStorage Gen 2 への接続

Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

  • SchemaADLSGen2 に設定。
  • Account:ストレージアカウント名に設定。
  • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
  • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

Azure DataLakeStorage Gen 2 への認証

Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

アクセスキーを使用した認証

アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

  1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
  2. 設定で「アクセスキー」を選択します。
  3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

共有アクセス署名(SAS)

共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

Exploratory 上でAzure Data Lake Storage のデータをセット

  • Exploratory で[コネクション]をクリックして新しいコネクションを作成します。
  • [追加]→[ODBC]の順にクリック。
  • コネクション追加画面で先ほど設定したAzure Data Lake Storage ODBC のDSN を設定します。
    名前:任意
    タイプ:ODBC
    DSN:上の設定したDSN 名(CData Azure Data Lake Storage Sys)
  • Adding new connection
  • コネクションテストを下の地、[追加]を押して接続を確定させます。

Exploratory でAzure Data Lake Storage データをクエリし、データフレームとして保存

さあ、Exploratory からAzure Data Lake Storage データを扱ってみましょう。

  • Exploratory でプロジェクトを[新規作成]します。
  • [データフレーム]の[+]印をクリックし、[データベースデータ]を選択します。
  • Create new Dataframe
  • データベースは[ODBC]をクリック。
  • Select ODBC
  • [コネクション]で先ほど設定したAzure Data Lake Storage のコネクションを選択します。
  • RDB ソースの感覚でSELECT クエリでAzure Data Lake Storage データをクエリします。標準SQL でフィルタリング、ソート、JOIN も可能です。
  • Query data using standard SQL
  • データセットをデータフレームとして保存します。

Exploratory でのAzure Data Lake Storage データの分析

データフレームになったデータは通常のRDB データソースと同じようにExploratory で利用可能です。

Query data using standard SQL

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。