製品をチェック

Azure Data Lake Storage Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage JDBC Driver 相談したい

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

Pentaho Report Designer にAzure Data Lake Storage データに連携して分析

Pentaho BI ツールでAzure Data Lake Storage のレポートを作成。

加藤龍彦
ウェブデベロッパー

最終更新日:2022-03-16
azuredatalake ロゴ

CData

jdbc ロゴ画像
Pentaho Report Designer ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。



CData JDBC Driver for ADLS はダッシュボードや帳票ツールからリアルタイムAzure Data Lake Storage データへの連携を可能にします。この記事では、Azure Data Lake Storage をJDBC データソースとして接続する方法と、Pentaho でAzure Data Lake Storage を元に帳票を作成する方法を説明します。

接続と帳票の作成

  1. インストールディレクトリの[lib]サブフォルダ内のJAR ファイルをコピーし、Pentaho のディレクトリ内の\Report-Designer\lib\jdbc\ フォルダに配置します。
  2. \Report-Designer\ フォルダのreport-designer.bat ファイルを起動し、Report-Designer UI を開きます。
  3. 以下の手順でドライバーを新しいデータソースに設定します。[Data]>[Add Data Source]>[Advanced]>[JDBC (Custom)]とクリックし、新しいAzure Data Lake Storage 接続を作成します。ダイアログが表示されたら、次のように接続プロパティを設定します。

    • Custom Connection URL property:JDBC URL を入力。初めに以下を入力し jdbc:adls: 次にセミコロン区切りで接続プロパティを入力します。

      Azure DataLakeStorage 接続プロパティの取得・設定方法

      Azure DataLakeStorage Gen 1 への接続

      Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

      • SchemaADLSGen1 を指定。
      • Account:アカウント名に設定。
      • AzureTenant:テナントId に設定。Azure Portal 内のAzure Data Lake プロパティから取得できます。
      • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

      Azure DataLakeStorage Gen 1 への認証

      Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。

      Azure DataLakeStorage Gen 2 への接続

      Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。

      • SchemaADLSGen2 に設定。
      • Account:ストレージアカウント名に設定。
      • FileSystem:このアカウントで使用するファイルシステム名に設定。例えば、Azure Blob コンテナ名など。
      • Directory:(オプション)複製したファイルを格納するためのパスを設定。指定しない場合は、ルートディレクトリが使用されます。

      Azure DataLakeStorage Gen 2 への認証

      Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。

      アクセスキーを使用した認証

      アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。

      Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。

      1. Azure ポータルのADLS Gen2 ストレージアカウントにアクセスします。
      2. 設定で「アクセスキー」を選択します。
      3. 利用可能なアクセスキーの1つの値を「AccessKey」接続プロパティにコピーします。

      共有アクセス署名(SAS)

      共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。

      以下は一般的なJDBC URL です:

      jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;
    • Custom Driver Class Name:cdata.jdbc.adls.ADLSDriver と入力。
    • User Name:認証するユーザーネーム。
    • Password:認証するパスワード。
    Required connection properties defined in the JDBC URL. (Salesforce is shown.)

レポートに Azure Data Lake Storage データを追加

これで、Azure Data Lake Storage の帳票を作成する準備が整いました。

  1. 帳票にAzure Data Lake Storage データソースを追加します:[Data]>[Add Data Source]>[JDBC]をクリックし、データソースを選択します。

  2. クエリを設定します。この記事では次を使います:

    SELECT FullPath, Permission FROM Resources WHERE Type = 'FILE' The query to retrieve data, specified in the JDBC data source configuration wizard. (Salesforce is shown.)
  3. 帳票にチャートをドラッグし、ダブルクリックしてチャートを編集します。帳票を実行して、チャートを表示します。このクエリ結果を使って、Resources テーブルのシンプルなチャートを作成することができます。
  4. 帳票を実行して、チャートを見てみましょう。
A chart generated from up-to-date data. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。