製品をチェック

GitHub Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

GitHub アイコン GitHub JDBC Driver 相談したい

GitHub 連携のパワフルなJava アプリケーションを素早く作成して配布。

GitHub データをDataiku DSS にロードして分析処理を行う方法:CData JDBC Driver

CData JDBC ドライバを使って、データサイエンスソフトのDataiku Data Science Studio で GitHub データ を分析処理。

宮本航太
プロダクトスペシャリスト

最終更新日:2022-05-20
github ロゴ

CData

jdbc ロゴ画像
Dataiku DSS ロゴ

こんにちは!プロダクトスペシャリストの宮本です。

Dataiku Data Science Studio (DSS) www.dataiku.com/は 開発者およびアナリスト向けのデータサイエンスプラットフォームです。

データベース、ファイル系を中心につなぎ先が色々とあります。その中に 「Custom connectivity through JDBC」とあるので、今回はそこに CData JDBC ドライバを組み込む内容となっています。
この記事では、Dataiku DSS で CData JDBC Driverを利用してGitHub データを扱う方法を紹介します。

Dataiku DSS に JDBC Driver for GitHubを配置する

  • CData JDBC Driver for GitHub をインストールします。
  • インストールが完了すると、lib ディレクトリに以下のようにjarファイル、licファイルが置かれました。
  • user@LAPTOP-T1M78GUR:~/cdata/github$ cd lib/ user@LAPTOP-T1M78GUR:~/cdata/github/lib$ ll total 7556 drwxr-xr-x 1 root root 4096 Feb 28 12:06 ./ drwxr-xr-x 1 root root 4096 Feb 28 12:06 ../ -rw-r--r-- 1 root root 7685088 Feb 27 14:53 cdata.jdbc.github.jar -rw-r--r-- 1 root root 368 Feb 28 12:06 cdata.jdbc.github.lic -rw-r--r-- 1 root root 951 Feb 27 14:40 cdata.jdbc.github.remoting.ini
  • 次に、jar ファイルと lic ファイルを Dataikuの DSS から参照できるよう以下のディレクトリに配置します。
  • user@LAPTOP-T1M78GUR:~/cdata/github/lib$ cp -p cdata.jdbc.github.jar /home/user/DATA_DIR/lib/jdbc/ user@LAPTOP-T1M78GUR:~/cdata/github/lib$ cp -p cdata.jdbc.github.lic /home/user/DATA_DIR/lib/jdbc/ user@LAPTOP-T1M78GUR:~/cdata/github/lib$ ll /home/user/DATA_DIR/lib/jdbc/ total 8064 drwxr-xr-x 1 user user 4096 Feb 28 12:15 ./ drwxr-xr-x 1 user user 4096 Feb 26 17:20 ../ -rw-r--r-- 1 user user 7685088 Feb 27 14:53 cdata.jdbc.github.jar -rw-r--r-- 1 user user 368 Feb 28 12:06 cdata.jdbc.github.lic user@LAPTOP-T1M78GUR:~/cdata/github/lib$
  • これで、DSS に CData GitHub JDBC Driver を組み込むことができました。

Data Science Studio(DSS)で GitHub データ データにアクセスする

  • 「NEW PROJECT」→ 「Blank Project」をクリックします。
  • Dataiku
  • データセットを作成していきます。「IMPORT YOUR FIRST DATASET」をクリックします。
  • Dataiku
  • ここでは、「Other SQL」を選択します。
  • Dataiku
  • 「IMPORT YOUR FIRST DATASET」をクリックしてください。
  • Dataiku
  • 「+ NEW CONNECTION」を選択します。
  • Dataiku
  • 「Other SQL databases」をクリックします。
  • Dataiku
  • 以下の内容を入力し、接続確認を行います。
    • Connection Name: 任意
    • JDBC driver class: cdata.jdbc.github.GitHubDriver
    • JDBC URL: jdbc:github:OAuthClientId=MyOAuthClientId;OAuthClientSecret=MyOAuthClientSecret;CallbackURL=http://localhost:portNumber;InitiateOAuth=GETANDREFRESH
  • Dataiku
  • 接続ができたら、横の「CREATE」ボタンを押して設定した内容を保存します。
  • またプロジェクト画面から「IMPORT YOUR FIRST DATASET」→「Other SQL」で以下の画面を呼び出します。 ここでは、先ほど登録した GitHub がデータソースとして選べるようになっています。赤枠にあるように、 GitHub のオブジェクトがテーブル一覧になって表示することができました。
  • Dataiku
  • プレビューからデータの中身を参照することができました。
  • Dataiku
  • あとは通常のRDB データセットと同じようにプロジェクトで作成したデータセットを使って分析や可視化を行います。
  • Dataiku

    このようにCData JDBC ドライバを使ってすることで、簡単にDataiku DSS でGitHub データ データをノーコードで連携し、分析に使うことが可能です。

    是非、CData JDBC Driver for GitHub 30日の無償評価版 をダウンロードして、お試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。