CData JDBC Driver for IBM Cloud Object Storage を使って、データサイエンスソフトのDataiku Data Science Studio で IBM Cloud Object Storage data を分析処理。
Dataiku Data Science Studio (DSS) www.dataiku.com/は 開発者およびアナリスト向けのデータサイエンスプラットフォームです。
データベース、ファイル系を中心につなぎ先が色々とあります。その中に 「Custom connectivity through JDBC」とあるので、今回はそこに CData JDBC Driver を組み込む内容となっています。
この記事では、Dataiku DSS で CData JDBC Driverを利用してIBM Cloud Object Storage データを扱う方法を紹介します。

※製品について詳しい情報をご希望の方は以下からお進みください。
- IBM Cloud Object Storage にほかのBI、ETL、開発ツールから接続したい:IBM Cloud Object Storage データ連携ガイドおよびチュートリアルのリストへ
- IBM Cloud Object Storage Drivers について詳細を知りたい:ドライバー詳細情報ページへ
- ほかのデータソースに連携したい:CData Drivers 一覧へ
- ドライバーの30日の無償トライアル版を使いたい:トライアル版ダウンロードページへ
- 製品の利用やライセンスについて相談したい:sales@cdata.co.jp までメールにてご相談ください。
Dataiku DSS に JDBC Driver for IBM Cloud Object Storageを配置する
- CData JDBC Driver for IBM Cloud Object Storage をインストールします。
- インストールが完了すると、lib ディレクトリに以下のようにjarファイル、licファイルが置かれました。
- 次に、jar ファイルと lic ファイルを Dataikuの DSS から参照できるよう以下のディレクトリに配置します。
- これで、DSS に CData IBMCloudObjectStorage JDBC Driver を組み込むことができました。
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage$ cd lib/
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage/lib$ ll
total 7556
drwxr-xr-x 1 root root 4096 Feb 28 12:06 ./
drwxr-xr-x 1 root root 4096 Feb 28 12:06 ../
-rw-r--r-- 1 root root 7685088 Feb 27 14:53 cdata.jdbc.ibmcloudobjectstorage.jar
-rw-r--r-- 1 root root 368 Feb 28 12:06 cdata.jdbc.ibmcloudobjectstorage.lic
-rw-r--r-- 1 root root 951 Feb 27 14:40 cdata.jdbc.ibmcloudobjectstorage.remoting.ini
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage/lib$ cp -p cdata.jdbc.ibmcloudobjectstorage.jar /home/user/DATA_DIR/lib/jdbc/
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage/lib$ cp -p cdata.jdbc.ibmcloudobjectstorage.lic /home/user/DATA_DIR/lib/jdbc/
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage/lib$ ll /home/user/DATA_DIR/lib/jdbc/
total 8064
drwxr-xr-x 1 user user 4096 Feb 28 12:15 ./
drwxr-xr-x 1 user user 4096 Feb 26 17:20 ../
-rw-r--r-- 1 user user 7685088 Feb 27 14:53 cdata.jdbc.ibmcloudobjectstorage.jar
-rw-r--r-- 1 user user 368 Feb 28 12:06 cdata.jdbc.ibmcloudobjectstorage.lic
user@LAPTOP-T1M78GUR:~/cdata/ibmcloudobjectstorage/lib$
Data Science Studio(DSS)で IBM Cloud Object Storage data データにアクセスする
- 「NEW PROJECT」→ 「Blank Project」をクリックします。
- データセットを作成していきます。「IMPORT YOUR FIRST DATASET」をクリックします。
- ここでは、「Other SQL」を選択します。
- 「IMPORT YOUR FIRST DATASET」をクリックしてください。
- 「+ NEW CONNECTION」を選択します。
- 「Other SQL databases」をクリックします。
- 以下の内容を入力し、接続確認を行います。
- Connection Name: 任意
- JDBC driver class: cdata.jdbc.ibmcloudobjectstorage.IBMCloudObjectStorageDriver
- JDBC URL: jdbc:ibmcloudobjectstorage:ApiKey=myApiKey;CloudObjectStorageCRN=MyInstanceCRN;Region=myRegion;OAuthClientId=MyOAuthClientId;OAuthClientSecret=myOAuthClientSecret;
- 接続ができたら、横の「CREATE」ボタンを押して設定した内容を保存します。
- またプロジェクト画面から「IMPORT YOUR FIRST DATASET」→「Other SQL」で以下の画面を呼び出します。 ここでは、先ほど登録した IBM Cloud Object Storage がデータソースとして選べるようになっています。赤枠にあるように、 IBM Cloud Object Storage のオブジェクトがテーブル一覧になって表示することができました。
- プレビューからデータの中身を参照することができました。
- あとは通常のRDB データセットと同じようにプロジェクトで作成したデータセットを使って分析や可視化を行います。










このようにCData JDBC Driver を使ってすることで、簡単にDataiku DSS でIBM Cloud Object Storage data データをノーコードで連携し、分析に使うことが可能です。
是非、CData JDBC Driver for IBM Cloud Object Storage 30日の無償試用版 をダウンロードして、お試しください。