Mac OS X 上のMS Excel でHDFS データを連携利用

詳細情報をご希望ですか?

無償トライアル:

ダウンロードへ

製品の詳細情報へ:

HDFS ODBC Driver

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで双方向連携。



iODBC でCData ODBC Driver for HDFS のDSN を作成し、Mac OS X 上のMicrosoft Excel でHDFS に連携。

Microsoft Excel は、データの入力、集計、グラフ表示、ピボットテーブル、マクロプログラミング言語など多様な機能により、Windows、Mac マシンを問わずビジネスユーザーに愛用されているアプリケーションです。 本記事では、iODBC でのHDFS DSN の作成方法と、Mac OS X で起動するMicrosoft Excel からのHDFSの連携利用について説明します。

Mac OS X へのCData ODBC Drivers のインストール

CData ODBC Driver for HDFS は、iODBC Driver マネージャに事前設定されているので、簡単に多くのツールから簡単に使うことができます。

iODBC のDSN の作成

ODBC Driver for HDFS をインストールすると、iODBC Driver マネージャに登録されます。iODBC Administrator でDSN の接続プロパティを入力する必要があります。 ドライバーのインストールで自動的にシステムDSN が作成されます。システムDSN はすべてのユーザーからアクセスできます。一方、ユーザーDSN はそのユーザーからしかアクセスできません。 ただし、システムDSN の設定には権限が必要です。

  1. ターミナルを開き、次のコマンドを入力して正しい権限でAdministrator を開きます: sudo /Applications/iODBC/iODBC\ Administrator.app/Contents/MacOS/iODBC\ Administrator
  2. System タブでCData HDFS データソースを開きます。
  3. Add ボタンをクリックし、key-value ペアの形で接続プロパティを入力します。

In order to authenticate, set the following connection properties:

  • Host: Set this value to the host of your HDFS installation.
  • Port: Set this value to the port of your HDFS installation. Default port: 50070

OAuth での認証の場合、OAuth フローが正しく実行されるためにDSN に追加でkey-value ペアを入力します:

Keyword  Value
OtherCheckPromptMode=False

Microsoft Excel からHDFS データにアクセス

上のステップで設定されたDSN を使って、Microsoft Excel からHDFS データにアクセスができます。

  1. Microsoft Excel を開き、スプレッドシートを開きます。
  2. データリボンの[データベース]から[新しいクエリ]を選択します。
  3. 上のステップで設定したユーザーもしくはシステムDSN を選択して、OK を押します。
  4. Microsoft Query ウィザードでクエリを作成します:
  5. [Return Data]をクリックして、クエリを実行して、Excel にデータを取得します。

CData ODBC Driver for HDFS を使って、簡単にExcel にHDFS を取得することができました。データ取得ができれば、Excel のパワフルな分析、レポート、変換機能を駆使して様々な処理を行うことが可能です。