製品をチェック

Impala Cmdlets の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Impala アイコン Impala Data Cmdlets 相談したい

Impala データにリアルタイム連携を実現するPowerShell Cmdlets。Cmdlets を使って、SQL Server と同感覚で多様なデータにリアルタイムアクセス。

PowerShell からImpala データに接続してデータの取得・更新・挿入・削除・CSV エクスポートを実行する方法

CData PowerShell Cmdlets を使って、Impala データに接続、データの取得・更新・挿入・削除・CSV エクスポートを実行する方法を紹介します。

加藤龍彦
デジタルマーケティング

最終更新日:2023-09-26
impala ロゴ

CData

powershell ロゴ画像
PowerShell ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

CData Cmdlets for ApacheImpala を使えば、PowerShell からImpala に手軽に連携して、データのCRUD やエクスポートを実行できます。

本記事では、Impala への接続方法からCSV エクスポート、データの操作までサンプルコード付きで解説していきます。

Impala への接続を設定

それでは、まずはImpala への接続設定からはじめていきましょう。接続設定にはCData Impala Cmdlets が必要となります。右側のサイドバーから製品の全機能が使える30日間の無償トライアルがダウンロードできるので、ぜひご利用ください。

インストールが完了したら、プロファイルに以下の行を追加してください。次のPowerShell セッションでモジュールがロードされます。

    Import-Module ApacheImpalaCmdlets;

Connect-ApacheImpala コマンドを使ってImpala との接続を設定します。各接続プロパティの取得方法は次に説明します。

    $conn = Connect-ApacheImpala  -Server "$Server" -Port "$Port"

Apache Impala に接続するには、ServerPort、およびProtocolVersion を設定してください。オプションでデフォルトのDatabase を指定することもできます。 NOSASL、LDAP、またはKerberos といった別の方法で接続するには、オンラインのヘルプドキュメントを参照してください。

これで接続設定は完了です。

Impala データを取得してCSV にパイプライン

接続が完了したので、Customers テーブルデータを取得して結果をCSV ファイルにエクスポートします。

Select-ApacheImpala -Connection $conn -Table Customers | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myCustomersData.csv -NoTypeInformation

このコードでは、Select-ApacheImpala から取得した結果をSelect-Object に流して、Export-Csv に渡す前にいくつかのプロパティを除外しています。これは、CData Cmdlets が接続情報、テーブル、およびカラム情報を結果セットのそれぞれの行に挿入するためです。それらの情報を表示したくない場合に、Export-Csv コマンドに渡す前に除外を先に行い、そのあとでCSV ファイルにエクスポートします。

それでは、続いてデータの削除や挿入・更新を実行してみます。

データの削除

以下のように、フィルタリングで合致するレコードを削除することができます。

Select-ApacheImpala -Connection $conn -Table Customers -Where "Country = US" | Remove-ApacheImpala

データの挿入と更新

データの挿入や更新を使って、加工やクレンジングも行えます。以下の手順では、CSV ファイルのデータを読み込んで挿入対象のオブジェクトに同じレコードが存在するかを確認した上で、存在する場合にはデータを更新、存在しない場合にはデータの挿入を行います。

Import-Csv -Path C:\MyCustomersUpdates.csv | %{
  $record = Select-ApacheImpala -Connection $ApacheImpala -Table Customers -Where ("Id = `'"+$_.Id+"`'")
  if($record){
    Update-ApacheImpala -Connection $apacheimpala -Table Customers -Columns ("City","CompanyName") -Values ($_.City, $_.CompanyName) -Where ("Id = `'"+$_.Id+"`'")
  }else{
    Add-ApacheImpala -Connection $apacheimpala -Table Customers -Columns ("City","CompanyName") -Values ($_.City, $_.CompanyName)
  }
}

おわりに

このように、CData Cmdlets を使えばPowerShell でのImpala データへの連携をシンプルに実現できます。ぜひCData PowerShell Cmdlets の30日間無償トライアルをダウンロードして、シンプルかつパワフルなデータ連携をお試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。