【徹底比較】データエンジニアがFivetranよりCData Syncを選ぶ5つの理由とは?

ETL / ELT ツールは、一見するとどれも大きく変わらないように見えるかもしれません。結局のところ、データをポイントA からポイントB に移動させるツールに過ぎないじゃないか、と。しかし、社内のインフラやデータセットが同一でないように、ETL ツールも実際には同一ではありません。

機能面以外にも、ソフトウェアベンダーのデータ移動やコネクタ連携へのアプローチが異なります。社内のニーズとツールの機能に不一致がある場合には、新しいデータ移動ツールが必要になるかもしれません。Fivetran は最近、100万行あたりのユニットコストの計算方法の変更を行い、これに伴い多くのユーザーがデータパイプラインの選択肢を見直しています。

この記事では、データエンジニアがFivetran よりもCData Sync を選ぶ5つの理由をご紹介します。

目次

1. あらゆる環境にデプロイできる柔軟性

社内のIT インフラがきれいに整理されていることはめったにありません。万能なアプローチは存在しないのです。ローカル環境、パブリッククラウド、プライベートクラウドなど、さまざまな環境に分散したアーキテクチャを持つ場合、SaaS 提供のETL(抽出、変換、ロード)ツールでは、企業のセキュリティ、コンプライアンス、パフォーマンス要件を満たす方法でデプロイすることが難しくなります。

Fivetran はSaaS として構築されており、ハイブリッドまたはセルフホスト型のオプションは最上位プラン(Enterprise およびBusiness Critical) でのみ利用可能です。Fivetran は、ローカルにホストされたエージェントを介してオンプレミスデータに接続します。こうしたエージェントベースのアプローチには以下の問題があります。

  • 新たな障害ポイントの導入
  • セキュリティリスクの追加
  • パフォーマンスの問題

こうした懸念は、多くのユーザーにとって導入を躊躇する要因となっています。

Sync は、すべての価格プランにて同価格でセルフホスト型とSaaS 版のソフトウェアを提供しています。ファイアウォールで保護された自社のネットワーク環境内で運用できます。また、Sync のインスタンスをインターネットから完全に切り離すこともできます。パフォーマンス基準を満たすためのクラスタリングインスタンスについても同様に保護できます。

2. あらゆるデータとの連携で高度な機能を提供

デプロイメントオプションがデータエンジニアにとって重要であるのと同様に、あらゆるデータソース・同期先にアクセスできることも重要です。さらに、データが正確で完全であることを信頼できる必要があります。

Fivetran は、Enterprise またはBusiness Critical 以外のプランではクラウド以外のデータソースを提供していません。これは、ハイブリッド環境を持つアカウントにとって深刻な制限です。一方Sync は、すべてのプランでオンプレミス・クラウドのデータソースへのアクセスを提供します。

データソースの幅広さは重要ですが、ただシステムに接続できればいい、というわけではありません。Fivetran は650以上のデータソースと連携可能と謳っていますが、そのうち少なくとも450はフルマネージドなドライバを使った連携ではなく、「ライト」API コネクションです。CData Sync はドライバベースの接続を基盤として構築されており、Sync には数百のAPI 接続に加えて、270以上のドライバベースの接続が含まれています。これにより、より広範なコネクタで高機能な連携を実現しています。

例えば、あるSync ユーザーは、Fivetran のJira コネクタがJira にある数百のカスタムフィールドを識別して複製できなかったため、Fivetran からSync に移行しました。さらに、Fivetran のJira コネクタは不要な履歴データの複製を要求し、それが追加の行単位の料金を発生させていました。Sync では、顧客はすべてのカスタムフィールドを複製でき、データウェアハウスに移動する列を正確にカスタマイズできます。

Sync は、オンプレミスとクラウドの両方のデータウェアハウスとシームレスに連携することで、データの可能性を最大限に引き出します。ほとんどのプランをクラウドのみのデスティネーションに制限するFivetran とは異なり、Sync はすべての顧客に対して幅広いデータベース(Fivetran の19に対して合計32)をサポートしています。これには、SQL Server、Oracle、DB2、MySQL、PostgreSQL、Snowflake、Databricks、BigQuery などが含まれます。この柔軟性により、企業はベンダーロックインなしで社内のハイブリッドクラウド環境でデータを移動、変換、分析することができます。

3. 予測可能な価格設定:接続数ベース vs 行数・使用量ベース

使用量ベースの価格設定は、ソフトウェア業界全体で普及しています。セルフホストクラウドではコンピューティングに対して支払いが発生します。Snowflake やDatabricks では、取り込まれるデータ量に対して支払いが発生します。Sync なら選択肢があります。

データ量が少ない企業であれば、ETL の使用量ベースの価格構造は理にかなっています。CData では、Fivetran で比較的少ないデータ量から始めた顧客から多くの声を聞きますが、行数が増えるにつれて、請求額も増加していくようです。

Sync は必要なデータ接続の数に基づいて価格が決まってくるので、予算計上とスケーリングは容易です。5つの接続と毎月最大1億行のデータ複製を許可しています。これは大きな違いであり、多くの人にとってSync を選ぶ明確な理由となっています。

4. ETL / ELT、リバースETL、カスタム変換を1つのツールで

乱立するソフトウェアを簡素化することは、すべての情シス部門が望んでいることです。データパイプラインを構築するための優れた特定用途のツールは確かに存在します。しかし多くの企業は、避けられる場合には、個別のソフトウェアを組み合わせることによる管理とコストのオーバーヘッドを望みません。

Fivetran は主にELT に注力しており、変換は処理後にのみ実行でき、主にFivetran から連携するdbt にアウトソースされています。また、Fivetran にはCRM などの運用システムに、エンリッチされたデータを戻すリバースETL を実行する機能がありません。そのため、必要な場合にはリバースETL 専用のソフトウェアを別途導入する必要があり、コストと複雑性が指数関数的に増加します。

一方、Sync はELT・ETL 双方を実行できるよう構築されており、処理中または処理後の変換が可能です。さらに、Sync は現在も拡張中のリバースETL 機能を備えており、ユーザーはSQL Server、Snowflake、Redshift のデータをSalesforce やDynamics 365 に書き戻すことができます。

Fivetran と同様に、Sync もdbt Core およびdbt Cloud と連携してデータ変換を容易にしますが、Sync はさらにカスタムSQL 変換も提供しており、高度なデータ操作と分析を可能にするカスタムスクリプトを処理できます。

5. データセキュリティ、ガバナンス、制御の粒度

すべてのソフトウェア導入にはトレードオフが伴います。無限のリソースがある場合に社内で設計できるものと完全に一致するツールは存在しません。

ETL ソフトウェアの導入を決定する際、情シス部門は信頼できる分析に使用できるデータを移動する最も効率的で、安全で、アクセスしやすい方法を求めています。CData は、セキュリティと制御を制限するのではなく、促進するものとしてSync を設計しました。

CData だけが提供するプライベートクラウド

Sync のSaaS 版は、各顧客に他のSync インスタンスから分離したプライベートクラウドインスタンスを提供します。これは、複数のアカウントが同じデータベースにアクセスするため、データ侵害に脆弱なモデルであるFivetran の共有クラウドとは対照的です。

データの完全な制御

データがどのように変更されるかについての透明性が欠如している、ブラックボックスのデータ正規化プロセスを適用するFivetran とは異なり、Sync は顧客が明示的に設定しない限り、変更が発生しないことを保証します。さらに、Sync はエンドツーエンドの暗号化を使用し、顧客データを保存しないため、CData がユーザー情報にアクセスすることはありません。

必要な頻度でデータを同期

パイプラインジョブのスケジューリングの制御も重要なポイントです。新しいデータへのアクセスが遅れて喜ぶユーザーはいません。バッチレプリケーションジョブの場合、Fivetran はStarter プランでは1時間に1回、Standard では15分に1回にスケジューリング頻度を制限しています。1分間隔のデータ同期のスケジューリングは、エンタープライズとビジネスクリティカルプランでのみ可能です。

Sync では、すべてのプランで1分間隔のスケジューリングが可能であり、プランアップの障壁なしにデータパイプラインをニアリアルタイムで制御できます。そのため、データを常に最新の状態に保つことができます。

簡単でコンプライアンスに準拠したCDC 設定

変更データキャプチャ(CDC)を設定するために必要な、データベースの管理者権限の昇格要件は、セキュリティとコンプライアンスの観点から現実的ではないとFivetran の顧客は感じています。Sync では、CDC を設定するためにデータベースの管理者権限を必要とせず、セットアップとパフォーマンスがより効率的で低リスクになっています。

CData Sync がFivetran に勝る理由

任意のデータソースと任意のデータベースまたはデータウェアハウス間の堅牢なデータレプリケーションパイプラインを迅速に展開するために、Sync とFivetran を比較してみてください。

Sync とFivetran のより詳しい比較はこちら >>

30日間無償トライアルでCData Sync の全機能をお試し

CData Sync は全機能を利用可能な30日間の無償トライアルを提供しています。3ステップで簡単に作成できるパイプライン、ETL / ELT 機能などSync の機能をぜひお試しください!

5分で製品機能を体験する

関連コンテンツ