製品をチェック

Azure Data Lake Storage Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage JDBC Driver 相談したい

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

Denodo Platform でAzure Data Lake Storage データソースを作成

CData JDBC ドライバを使ってDenodo Virtual DataPort Administrator でAzure Data Lake Storage データ の仮想データソースを作成します。

桑島義行
テクニカルディレクター

最終更新日:2022-02-28
azuredatalake ロゴ

CData

jdbc ロゴ画像
Denodo ロゴ

こんにちは!テクニカルディレクターの桑島です。

Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for ADLS と組み合わせると、Denodo ユーザーはリアルタイムAzure Data Lake Storage データと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でAzure Data Lake Storage の仮想データソースを作成する手順を紹介します。

最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムAzure Data Lake Storage データを扱う上で比類のないパフォーマンスを提供します。Azure Data Lake Storage にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をAzure Data Lake Storage に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってAzure Data Lake Storage データを操作および分析できます。

Azure Data Lake Storage Virtual Port を作成

Denodo からリアルタイムAzure Data Lake Storage データに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。

  1. CData JDBC Driver for ADLS インストーラーをダウンロードしてパッケージを展開し、JAR ファイルを実行してドライバーをインストールします。
  2. JAR ファイル(およびライセンスファイルがある場合はそれも)をインストール先(通常はC:\Program Files\CData\CData JDBC Driver for ADLS\lib\)からDenodo 外部ライブラリディレクトリ(C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-adls-19)にコピーします。
  3. Denodo Virtual DataPort Administration Tool を開き、Server Explorer タブに移動します。
  4. 「admin」を右クリックし、「New」->「Data source」->「JDBC」を選択します。 新しいJDBC データソースを作成
  5. JCBC Connection を設定します。
    • Name:任意の名前(例:adls)
    • Database adapter:Generic
    • Driver class path:C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-adls-19
    • Driver class:cdata.jdbc.adls.ADLSDriver
    • Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。

      jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;InitiateOAuth=GETANDREFRESH

      JDBC コネクションを設定(NetSuite の場合)

      Database URI の作成については以下を参照してください。

      組み込みの接続文字列デザイナー

      JDBC URL の作成の補助として、Azure Data Lake Storage JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。

      java -jar cdata.jdbc.adls.jar

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Azure DataLakeStorage 接続プロパティの取得・設定方法

      Azure DataLakeStorage Gen 1 への接続

      Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

      • SchemaADLSGen1 を指定。
      • Account:アカウント名に設定。
      • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
      • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

      Azure DataLakeStorage Gen 1 への認証

      Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

      Azure DataLakeStorage Gen 2 への接続

      Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

      • SchemaADLSGen2 に設定。
      • Account:ストレージアカウント名に設定。
      • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
      • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

      Azure DataLakeStorage Gen 2 への認証

      Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

      アクセスキーを使用した認証

      アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

      Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

      1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
      2. 設定で「アクセスキー」を選択します。
      3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

      共有アクセス署名(SAS)

      共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

      組み込みの接続文字列デザイナーを使ってJDBC URL を生成(Salesforce の場合)
  6. 「接続テスト」をクリックして設定を確認し、「保存」をクリックします。

Virtual DataPort Administration Tool でAzure Data Lake Storage データを表示

データソースを作成したら、Denodo Platform で使用するAzure Data Lake Storage データの基本ビューを作成できます。

  1. 新しく作成したVirtualPort(admin.ADLS)で「Create base view」をクリックします。
  2. オブジェクトツリーを展開し、インポートしたいオブジェクト(テーブル)を選択します。 インポートするオブジェクトの選択(NetSuite の場合)
  3. 「Create selected」をクリックしてAzure Data Lake Storage データのビューを作成します。
    オプション:「Create associations from foreign keys」をクリックして、オブジェクト間の関係を定義します。
  4. ビューを作成した状態で、Server Explorer のテーブル(cdata_adls_resources)に移動し、選択したテーブルをダブルクリックします。
  5. 新しいタブで「Execution panel」をクリックしてクエリパネルを開きます。
  6. 「Execute」タブでクエリをカスタマイズするか、デフォルトを使用します。
    SELECT * FROM cdata_adls_resources CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
    
    データを表示するクエリを設定
  7. 「Execute」をクリックすると、データが表示されます。 データを表示

基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムAzure Data Lake Storage データを操作できるようになります。例えば、Denodo Data Catalog でAzure Data Lake Storage にクエリを実行できます。

CData JDBC Driver for ADLS の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムAzure Data Lake Storage データの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。