本記事はCData Software Calendar 2024 12月13日の記事です。
こんにちは!パートナーサクセスエンジニアの今西です。
JTUG(Japan Tableau User Group)総会 2024 でお話した内容を文章でもお届けします!
不動産の成約情報を誰でも閲覧可能にした『不動産情報ライブラリ』や各市区町村が公開している『オープンデータ』をCData Sync を用いて、Tableau で可視化し、実際に注文住宅を購入した話です。
よろしければspeakerdeck にアップした下記スライドを眺めながら、ご一読いただけると嬉しいです!
データ活用で大切なのは、次のアクションへ繋がる洞察を得ること
こちらの文章をお読みの貴方へ「なんのためにデータを使いますか?」と質問です。
私は「正解のない膨大な選択肢の中から、より良い打ち手を探し出し、正解にたどり着くこと」だと思っています。言い換えれば「データを用いて、次のアクションへ繋げる洞察を得ること」だと考えています。
データ活用というとビジネスの場で話されがちですが、私はプライベートでこそ積極的に利用すべきだと考えています。
特に不動産購入は、人生の中で一度あるかないかの大きな決断です。
日本では1世帯あたりの一生にかかる費用が約3億円、そのうち住宅が占める割合は約4,200万円かかるというデータがあります。
こういった大きな決断にこそ、データを活用して、自分なりの正解を探すことが大切だと思うのです。
データ利用の目的を明確にする
データを可視化する前に「どんなことがわかれば意思決定ができそうか?」を明確にする必要がありました。そのために家族で要望を整理し、家に求めている条件を言語化するところからはじめています。
結果、下記のような内容が家族が家に求める条件であることがわかりました。
そのデータはどこから取ってくるの?
不動産情報ライブラリと、国や各市区町村が発表しているオープンデータで情報が得られそうなことがわかりました。この中でもTableau で可視化できそうなデータを更に絞り込みました。
不動産情報ライブラリのAPI の申請方法
さて、早速不動産情報ライブラリAPI を使ってデータを取れるようにしていきましょう。不動産情報ライブラリのAPI を利用するには申請が必要です。
「不動産情報ライブラリ 」にアクセスし、「API 利用申請」をクリック。必要情報を記載し申請すると、通常5営業日内に登録したメールアドレス宛にAPI キーが届きます。
私は申請してから3日後に届きました。
ちなみに、不動産情報ライブラリ API では下記のような情報が得られます。
ご自身で不動産を購入する際の調査にはもちろん、ここでは触れませんが投資用の物件を探す際にも使えそうな情報がまとまっています。
・地価公示 ・都道府県地価調査 ・不動産取引価格情報 ・成約価格情報 ・学校・小・中学校区 ・市町村役場等 ・医療機関 ・福祉施設 ・洪水浸水想定区域 ・津波浸水想定 ・用途地域 ・防火・準防火地域 ・立地適正化区域 ・将来推計人口
CData Sync で不動産情報ライブラリのAPI を使う
ここで登場するのが、CData Sync とTableau を使ったデータ可視化です。
CData Sync は400種類を超えるさまざまなデータソースと簡単に連携できるツールで、不動産情報ライブラリや市区町村のオープンデータを1つのデータベースへ移すのに非常に役立ちます。
トライアル環境 等でCData Sync をセットアップします。インストールからセットアップまでは下記記事をご参考にしてください。
CData Sync製品のインストール、初期設定
不動産情報ライブラリ API を接続設定に加える
早速不動産情報ライブラリ API をCData Sync から接続できるようにしましょう。
左タブの「接続」をクリック
「データソース」タブになっていることを確認
「API」をクリック
接続名はお好きなお名前をつけてください。
「テーブル」タグをクリック
「テーブルを追加」をクリック
設定項目
設定内容
リクエストURL(GET)
https://www.reinfolib.mlit.go.jp/ex-api/external/XIT001
パラメーター(city) ※取得したい値
12231
パラメーター(year) ※取得したい値
2024
ヘッダー(Ocp-Apim-Subscription-Key)
申請承認されたときのAPI キー
市区町村コードの取得方法は?
都道府県内市区町村一覧取得API に取得方法の記載があります。 下記は千葉県の市区町村コードを取得する際のサンプルになります。
設定項目
設定内容
リクエストURL(GET)
https://www.reinfolib.mlit.go.jp/ex-api/external/XIT002
パラメーター(area) ※取得したい値
12
ヘッダー(Ocp-Apim-Subscription-Key)
申請承認されたときのAPI キー
テーブル化の設定
API で受け取ったデータを、テーブルの形になるよう整形をします。
「テーブルを設定」をクリック
レスポンスをプレビュー画面を確認し、取得できていることを確認したら「次へ」をクリック
繰り返し要素「/data」にチェックをいれ、「次へ」をクリック
テーブル化したい「カラム」にチェックをいれ、「次へ」をクリック
テーブルをプレビューを確認し「名前」をつけ、「確認」をクリック
同期先の接続を作成(ここではsnowflake)
不動産情報ライブラリAPI のデータの同期先設定をします。 Tableau ユーザー利用の多い「snowflake」を選定してみました。
設定項目
内容
接続名
任意の名称を設定(例:snowflake_jtug)
Warehouse
Warehouse 名
URL
URL 名
Database
Database 名
Auth Scheme
任意の認証方法を設定
ジョブを設定
同期元(不動産情報ライブラリAPI)、同期先(snowflake)の設定ができたら、レプリケーションするジョブを作成します。
詳しい設定方法は下記ハンズオン資料をご覧ください。
CData Syncハンズオン|資料SalesforceのデータをMySQLに複製するジョブの作成
要件に合致する市町村は2つ
千葉県だけでも54市町村あるため、いきなり細かい分析に入るのは手間がかかります。 そこでまずは、条件に合致している市町村を洗い出すことにしました。
54市町村の犯罪率を比べてみる
赤色が平均より上の市区町村、青色が平均より犯罪率が低い市区町村です。 安心して子育てできる環境は犯罪率が少ないところを選ぶべきかと思い可視化しました。
15歳未満の割合
子どもの割合が現段階で多い市区町村であれば、子育て世代が多いと推察して可視化しました。 印西市と流山市が突出していることがわかりました。
2年連続で15歳未満の割合が上昇している市区町村
子どもの割合が増えている市区町村であれば、子育て世代が過ごしやすい地域であると推察して選びました。
ここでも印西市と流山市が突出していることがわかりました。
結果、この2市町村をまずは可視化・分析し、お目当ての物件がなければまた別の市区町村を可視化することに決めました。
印西市・流山市の値を可視化してみた
CData Sync を使って連携したデータを元に、Tableau でダッシュボードを作成しました。
赤色が「印西市」、青色が「流山市」です。15歳未満の増加率や、世代別の居住割合はどちらもだいたい同じ。
犯罪率がダントツで少ないのは「流山市」、ただ坪単価が倍くらい高いのも「流山市」でした。
犯罪率の差と坪単価を天秤にかけるかどうかで、どちらを選ぶことになりそうです。この後それぞれの物件を実際に歩いて確認した結果、印西市を購入することになりました。
JTUG 総会では触れられませんでしたが、「駅までの徒歩何分か」「土地の形状」「前面道路の種類/方位」等でも絞り込みを行えるようにしています。
データを元に不動産購入をした学び
データを基に購入の判断を行った結果、営業トークに惑わされることなく、冷静に自分たちのペースで購入を進められました。
特に「今だけの価格」というような営業の言葉に対しても、過去の取引事例を元に判断できたため、余裕を持って購入に至ることができました。家族で決めた要望もすべて実現でき、現在はとても満足しています。
この経験から得た最大の学びは、データを活用し自分なりの正解の選択肢を選べたことです。データ収集や整形は確かに重要ですが、それよりも「どのように意思決定を行うか」に時間を使うべきだと感じました。データ連携を簡単にし、意思決定に必要な時間を最小限に抑えることが、ビジネスでもプライベートでも大切だと実感しています。
まとめ
データ活用はビジネスの現場だけのものではありません。プライベートにも活用することでより納得感を得た選択肢を選べます。
CData Sync のようなツールを使ってデータを簡単に連携し、可視化することで、より賢明な意思決定が可能になります。皆さんもぜひ、データを活用してより良い選択をしてみてください!
関連コンテンツ