本記事では CData サポート担当からこんなことを聞かれたらどこを確認すべきか?という観点で、よく頂くお問合せ内容をご紹介します。
記事はこちら →CData Cmdlets Module for SASDataSets は、直感的なSAS Data Sets データ連携を提供する標準cmdlet です。 本記事では、SASDataSets Cmdlets を使ったサンプルを提供します。
SAS DataSets ファイルに接続するには、次の接続プロパティを設定します。
$conn = Connect-SASDataSets -URI "$URI"
次の手順で、restaurants テーブルデータを取得して、結果をCSV ファイルにエクスポートします:
Select-SASDataSets -Connection $conn -Table restaurants | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myrestaurantsData.csv -NoTypeInformation
このように、Select-SASDataSets から取得した結果を、Select-Object cmdlet に流し、Export-Csv cmdlet に渡す前にいくつかのプロパティを除外しています。これは、CData Cmdlets が接続情報、テーブル、およびカラム情報が結果セットのそれぞれの"行"に挿入されるためです。それらの情報を表示したくない場合に、Export-Csv cmdlet に渡す前に除外を先に行い、それからCSV ファイルにエクスポートします。。
CData Cmdlets から、次のCmdlets にデータをパイプラインするところでは、接続、テーブル、カラムの情報が必要です。以下のように、指定に合致するレコードを削除することができます:
Select-SASDataSets -Connection $conn -Table restaurants -Where "cuisine = American" | Remove-SASDataSets
CData Cmdlets は、データの加工やクレンジングを行うことができます。以下の手順では、CSV ファイルのデータを、挿入対象のオブジェクトに同じレコードが存在するかを確認した上で、存在する場合にはデータの更新、存在しない場合にはデータの挿入を行います。
Import-Csv -Path C:\MyrestaurantsUpdates.csv | %{ $record = Select-SASDataSets -Connection $SASDataSets -Table restaurants -Where ("Id = `'"+$_.Id+"`'") if($record){ Update-SASDataSets -Connection $sasdatasets -Table restaurants -Columns ("name","borough") -Values ($_.name, $_.borough) -Where ("Id = `'"+$_.Id+"`'") }else{ Add-SASDataSets -Connection $sasdatasets -Table restaurants -Columns ("name","borough") -Values ($_.name, $_.borough) } }
このように、CData Cmdlets でデータ連携をシンプルに構成できます。Cmdlets では、モジュールのインストール、接続プロパティの設定だけで、データ連携の構築を始めることができます。是非、CData PowerShell Cmdlets の無償試用版をダウンロードして、シンプルかつパワフルなデータ連携を体感してください。