各製品の資料を入手。
詳細はこちら →CData
こんにちは!リードエンジニアの杉本です。
今回は、クロスユーアイエス社の国産セルフサービスBI ツールData Knowledge とCData ODBC ドライバを組み合わせて、JSON データの分析・可視化を行う方法を紹介します。
Data Knowledge は株式会社クロスユーアイエスが提供する国産セルフサービスBI ツールです。わかりやすいインターフェースとシンプルな手順でデータの可視化を行うことができ、BI ツールを使用した経験がない人でも簡単に使うことができます。
さて、今回の記事ではData Knowledge からJSON に接続していきますが、このときに必要となるのがCData ODBC ドライバです。
Data Knowledge にはODBC を経由してExcel やAccess、SQL Server などに接続する機能が標準提供されています。この機能とCData が提供しているODBC Drivers ラインナップを組み合わせることで、各種クラウドサービスのAPI やデータベースにシームレスにアクセスすることができるようになります。
とは言っても、説明だけではイメージできない部分もあると思うので、実際に連携を試してみましょう。今回はData Knowledge とJSON のデータを組み合わせて以下のようなクロス集計の表を作ってみたいと思います。
まずは、CData JSON ODBC Driver を対象のマシンにインストール・セットアップします。インストーラーを立ち上げると、以下のような画面になるので、ダイアログに従ってセットアップを完了してください。
セットアップ完了後、接続設定画面が立ち上がりますので、JSON への接続情報を設定してください。
データソースへの認証については、ヘルプドキュメントの「はじめに」を参照してください。CData 製品は、JSON API を双方向データベーステーブルとして、JSON ファイルを読み取り専用ビュー(ローカル ファイル、一般的なクラウドサービスに保存されているファイル、FTP サーバー)としてモデル化します。HTTP Basic、Digest、NTLM、OAuth、FTP などの主要な認証スキームがサポートされています。詳細はヘルプドキュメントの「はじめに」を参照してください。
URI を設定して認証値を入力したら、DataModel を設定してデータ表現とデータ構造をより厳密に一致させます。
DataModel プロパティは、データをどのようにテーブルに表現するかを制御するプロパティで、次の基本設定を切り替えます。
リレーショナル表現の設定についての詳細は、ヘルプドキュメントの「JSON データのモデリング」を参照してください。また、以下の例で使用されているサンプルデータも確認できます。データには人や所有する車、それらの車に行われたさまざまなメンテナンスサービスのエントリが含まれています。
URI をバケット内のJSON ドキュメントに設定します。さらに、次のプロパティを設定して認証します。
URI をJSON ファイルへのパスに設定します。Box へ認証するには、OAuth 認証標準を使います。 認証方法については、Box への接続 を参照してください。
URI をJSON ファイルへのパスに設定します。Dropbox へ認証するには、OAuth 認証標準を使います。 認証方法については、Dropbox への接続 を参照してください。ユーザーアカウントまたはサービスアカウントで認証できます。ユーザーアカウントフローでは、以下の接続文字列で示すように、ユーザー資格情報の接続プロパティを設定する必要はありません。 URI=dropbox://folder1/file.json; InitiateOAuth=GETANDREFRESH; OAuthClientId=oauthclientid1; OAuthClientSecret=oauthcliensecret1; CallbackUrl=http://localhost:12345;
URI をJSON ファイルを含むドキュメントライブラリに設定します。認証するには、User、Password、およびStorageBaseURL を設定します。
URI をJSON ファイルを含むドキュメントライブラリに設定します。StorageBaseURL は任意です。指定しない場合、ドライバーはルートドライブで動作します。 認証するには、OAuth 認証標準を使用します。
URI をJSON ファイルへのパスが付いたサーバーのアドレスに設定します。認証するには、User およびPassword を設定します。
デスクトップアプリケーションからのGoogle への認証には、InitiateOAuth をGETANDREFRESH に設定して、接続してください。詳細はドキュメントの「Google Drive への接続」を参照してください。
あとは「接続のテスト」ボタンをクリックし、接続が成功したら、「接続ウィザード」の「OK」ボタンをクリックして保存します。
続いてData Knowledge へログインし作業を進めていきます。
ログイン後以下のような画面に移動するので「メインへ移動する」をクリック。続いて「管理」をクリックして、以下のような管理画面に移動します。ここから接続設定の構成を進めていきます。
Data Knowledge では最初に資源サーバーという形で接続先のRDB の情報などを管理します。ここに先程作成したCData ODBC ドライバの接続情報を指定します。
「資源サーバー」タブに移動し、「新規」をクリックします。
資源サーバー登録画面が表示されるので、任意の「資源サーバーID」と「資源サーバー名」を入力します。
続いて接続設定で「個別で指定」のラジオボタンを指定し、サーバータイプを「ODBC」「ドライバ:データソースを使用する」と選択します。
認証はODBC DSN で事前に指定しているため、「指定しない」でOKです。
最後にホスト(アドレス)/データソースに先程構成したODBC DSNのシステムDSNである「CData JSON Sys」を入力して登録します。
続いてData Knowledge で利用するデータモデルをホストファイルという形で登録します。
「ホストファイル」タブに移動し、「新規」をクリックします。
任意のホストファイルID とホストファイル名を指定し、テーブル構成の「更新」をクリックしましょう。
左メニューの資源サーバーに先程追加したJSON のデータモデルが表示されますので、ここでData Knowledge で分析したいテーブルをドラッグアンドドロップで取り込みます。
以下のように取り込めればOKです。登録ボタンをクリックして保存します。
また、必要に応じてサンプルも登録しておきましょう。
ホストファイルは追加しただけだとユーザーが利用できませんので、資源ロールに権限を追加します。「資源ロール」タブに移動し、利用する資源ロールを選択します。
ホストファイルの欄から「+追加」ボタンをクリックし
先程作成したホストファイルを追加します。
追加後、「登録」ボタンをクリックすればロールの構成は完了です。
それでは登録したホストファイルをもとに実際のデータの分析・デザインの作成を行っていきましょう。まず、利用メニューに戻ります。
デザインの管理画面から「新規」をクリックして、新しくデザインを作成していきます。
デザインの作成では最初に事前に登録したホストファイルを選択します。
ホストファイルを選択すると、次にどの項目を取り込んでデザインを選択するか?の画面に移るので、任意の項目を選択しましょう。
デザインの編集画面では集計項目や並び順が調整できます。
加工の画面ではデータの抽出条件を設定できます。
出力画面では抽出したデータの結果をどのようなデザインで表現するか、を設定できます。今回はクロス表を表示するような構成にしてみました。
以下のようにクロス集計の縦軸・横軸・集計項目を指定しています。
あとは任意の名前を入力して「実行」します。
正常に実行が完了すると、結果の表示後集計表が作成されます。
このようにCData ODBC ドライバを利用することで、各種クラウドサービスを Data Knowledge に取り込んでデザインを作成することができます。
CData ではJSON 以外にもODBC Driver を多数提供しています。270種類以上のデータソースをサポートしているので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。