Dataiku Data Science Studio (DSS) www.dataiku.com/は 開発者およびアナリスト向けのデータサイエンスプラットフォームです。
データベース、ファイル系を中心につなぎ先が色々とあります。その中に 「Custom connectivity through JDBC」とあるので、今回はそこに CData JDBC Driver を組み込む内容となっています。
この記事では、Dataiku DSS で CData JDBC Driverを利用してHBase データを扱う方法を紹介します。
※製品について詳しい情報をご希望の方は以下からお進みください。
Dataiku DSS に JDBC Driver for HBaseを配置する
- CData JDBC Driver for HBase をインストールします。
- インストールが完了すると、lib ディレクトリに以下のようにjarファイル、licファイルが置かれました。
user@LAPTOP-T1M78GUR:~/cdata/apachehbase$ cd lib/
user@LAPTOP-T1M78GUR:~/cdata/apachehbase/lib$ ll
total 7556
drwxr-xr-x 1 root root 4096 Feb 28 12:06 ./
drwxr-xr-x 1 root root 4096 Feb 28 12:06 ../
-rw-r--r-- 1 root root 7685088 Feb 27 14:53 cdata.jdbc.apachehbase.jar
-rw-r--r-- 1 root root 368 Feb 28 12:06 cdata.jdbc.apachehbase.lic
-rw-r--r-- 1 root root 951 Feb 27 14:40 cdata.jdbc.apachehbase.remoting.ini
- 次に、jar ファイルと lic ファイルを Dataikuの DSS から参照できるよう以下のディレクトリに配置します。
user@LAPTOP-T1M78GUR:~/cdata/apachehbase/lib$ cp -p cdata.jdbc.apachehbase.jar /home/user/DATA_DIR/lib/jdbc/
user@LAPTOP-T1M78GUR:~/cdata/apachehbase/lib$ cp -p cdata.jdbc.apachehbase.lic /home/user/DATA_DIR/lib/jdbc/
user@LAPTOP-T1M78GUR:~/cdata/apachehbase/lib$ ll /home/user/DATA_DIR/lib/jdbc/
total 8064
drwxr-xr-x 1 user user 4096 Feb 28 12:15 ./
drwxr-xr-x 1 user user 4096 Feb 26 17:20 ../
-rw-r--r-- 1 user user 7685088 Feb 27 14:53 cdata.jdbc.apachehbase.jar
-rw-r--r-- 1 user user 368 Feb 28 12:06 cdata.jdbc.apachehbase.lic
user@LAPTOP-T1M78GUR:~/cdata/apachehbase/lib$
- これで、DSS に CData ApacheHBase JDBC Driver を組み込むことができました。
Data Science Studio(DSS)で HBase data データにアクセスする