和歌山県における空き家分布推定に関する研究
最終更新日:2024年6月24日
総務省統計局、(独)統計センター、和歌山県、和歌山市及び東京大学との共同研究プロジェクト
概要
和歌山市が保有する各種公共データ(住民基本台帳、水道使用量情報、建物登記情報)と、空き家分布の調査データを活用することで、和歌山市全域の空き家分布状況を迅速、安価に推定するモデルを構築するとともに、同モデルの信頼性の検証を実施。
また、同モデルを用いて、和歌山市全域の空き家率を推定し、その結果を地図化した結果を作成するとともに、和歌山市が実施した空き家分布の調査データから得られる真値とモデルによる推定値を比較し、その違いを考察。さらには、同モデルに公的統計データを追加して活用する方法についても検討。
分析結果
- 本研究を実施するにあたり、和歌山市から提供された公共データ(住民基本台帳、建物登記情報、水道利用量情報及び和歌山市空き家実態調査)の変数の概要やデータレイアウト構造を把握。
- 住民基本台帳、建物登記情報、水道利用量情報及び和歌山市空き家実態調査は住所をキー変数としており、住所の表記ゆれ問題に対応する方法として「ジオコーディング」と呼ばれる住所を緯度・経度といった位置座標に変換する手法により、データ統合を実施。
- 推計モデルの構築には、機械学習的分類手法のひとつであるXGBoost(etreme Gradient Boosting)を用いた。
- 空き家分布推定結果と信頼性の検証について、市全域と地区別に分析を実施。
- 今後、精度検証を踏まえた改善点を検討するとともに公的統計(国勢調査及び住宅・土地統計調査)のみからの推計の検証や、公的統計データを組み合わせた活用方法の検討行う予定。
- 令和元年度研究成果報告書(PDF形式 2,426キロバイト)
研究体制
研究代表者・分担者の別 | 氏名 | 所属機関 |
---|---|---|
研究代表者 | 秋山 祐樹 | 東京大学 空間情報科学研究センター |
研究分担者 | 馬場 弘樹 | 東京大学 空間情報科学研究センター |
研究分担者 | 徳冨 智哉 | 和歌山県データ利活用推進センター |
解説
EBPMに資するデータ利活用推進の一環として、総務省統計局、(独)統計センター、和歌山県、和歌山市及び東京大学と連携し、統計データや行政データを活用した行政課題解決に資する共同研究として実施するものである。
本研究を通して和歌山市が保有する各種公共データ(住民基本台帳、水道使用量情報、建物登記情報)と、和歌山市による空き家調査データを活用することにより、和歌山市全域の空き家分布状況を迅速、安価に推定するモデルの構築が実現した。また、同モデルの信頼性の検証も実施し、その結果、十分に高い信頼性であることも明らかとなった。さらに同モデルから得られた結果から、和歌山市全域の空き家率を推定し、その結果を組み合わせて活用する方法、あるいは公的データのみから空き家率を推定する方法についての可能性の検討も実施している。
未だ研究途上であることから、今後、令和元年度に構築したモデルを改善して信頼性の向上を目指すとともに、他自治体(和歌山県内の他の市町村)への展開も検討したい。具体的には和歌山市で構築したモデルを用いて、他の自治体の空き家の分布状況を推定したり、和歌山市では利用できなかった他の公共データを活用したモデルの構築などの展開が挙げられる。また、検討だけに留まった公的統計データの具体的な活用についても実施していきたいと考えている。
令和2年度
概要
そこで、令和2年度の研究ではさらに公的統計(国勢調査)を追加してモデルを構築することで、公的統計から抽出した特徴量が空き家分布の推定精度向上にどれほど寄与するのかについて分析を行った。また、自治体保有データを用いることなく国勢調査のみを用いた推定手法により、どれほどの推定精度を確保することができるのかを明らかにし、他の自治体への適用可能性についても検討した。
分析結果
- 公共データのみを用いて分析したモデルと、公共データと国勢調査の両方を用いて分析したモデルを比較した結果、国勢調査を加えたとしても推定結果が改善することはなかった。この原因としては、公共データは建物単位で集計が行われている、非常に空間解像度の高いデータである一方、国勢調査は基本調査区単位で集計が行われていたため、公共データに比べてデータの空間解像度が低く、推定モデルにうまく反映されなかったためだと考えられる。
- 国勢調査のみで基本調査区ごとの空き家率を推定するモデルの予測性能は比較的高かった。すなわち、国勢調査のみを用いた空き家分布推定も、建物単位という高い解像度では困難ではあるが、基本調査区、さらには町丁目や地域メッシュなどの単位における空き家率や空き家数の推定においては、十分に利用価値があることが明らかとなった。
- 水道データの吸着有無によってモデルを分類した結果、空き家の分類に予測上重要なのは、水道が閉栓しているか否かということより、むしろ水道データが吸着しているか否かということであると分かった。この結果は、市が行う空き家実態調査の前提に影響を与える。現在の実態調査は水道閉栓情報等を基に空き家候補を割り出しているが、むしろ水道閉栓情報のない建物こそが空き家の候補になり得るからである。
- 令和2年度研究成果報告書(PDF形式 1,573キロバイト)
研究体制
研究代表者・分担者の別 | 氏名 | 所属機関 |
---|---|---|
研究代表者 | 秋山 祐樹 | 東京大学空間情報科学研究センター |
研究分担者 | 馬塲 弘樹 | 東京大学空間情報科学研究センター |
研究分担者 | 左右田 敢太 | 東京大学空間情報科学研究センター |
研究分担者 | 洪 義定 | 東京大学空間情報科学研究センター |
研究分担者 | 徳冨 智哉 | 和歌山県データ利活用推進センター |
令和3年度
概要
令和2年度の研究ではさらに公的統計(国勢調査)を追加してモデルを構築することで、公的統計から抽出した特徴量が空き家分布の推定精度向上にどれほど寄与するのかについて分析を行った。また、自治体保有データを用いることなく国勢調査のみを用いた推定手法により、どれほどの推定精度を確保することができるのかを明らかにした。
今年度の研究では2つの点について検証を行った。第1に、和歌山市で学習したモデルを異なる地域に適用することがどの程度可能であるかを明らかにすることを試みた。この際、公共データを用いたモデルによる建物毎の予測と同様に、国勢調査のみを用いたモデルによる基本単位区毎の予測も行った。第2に、公的統計を用いた空き家予測モデルを改良するために、国勢調査と住宅・土地統計調査を組み合わせたモデルの予測精度について検証した。住宅・土地統計は国勢調査と異なり、全体の1割程度の調査区を抽出して行われる統計的調査である。従って全ての調査区でデータが整備されているわけではない。しかし、住宅や土地の詳細な情報を含んでいるため、空き家予測には大きく貢献するものと思われる。
分析結果
- 和歌山県田辺市において、和歌山市で学習したモデルを外挿したところ、公共データを用いた建物単位の空き家検出では適合率・再現率ともに低く、十分な精度が出なかった。一方、基本単位区ごとの空き家率の予測では、地域に関係なく高い精度を維持していた。
- 和歌山県田辺市および橋本市において、それぞれの市が保有する公共データを用いた空き家検出モデルを構築したところ、田辺市では空き家に該当するデータに重み付けを行うことで再現率が向上したものの、適合率は減少した。一方、橋本市では、使用するデータを「住基・水道データのみ」、「住基データのみ」と減らすほど、適合率の高さを維持したまま再現率を向上させることができた。ただし、この結果は過大評価されている可能性が高いため注意が必要である。
- 国勢調査と住宅・土地統計調査を組み合わせたモデルの予測精度についての検証を行った。その結果、国勢調査に住宅・土地統計調査を組み合わせることで予測精度が向上した。さらに、複数年次の国勢調査を用いることで、空き家率予測の精度がより向上することが確認された。
研究体制
研究代表者・分担者の別 | 氏名 | 所属機関 |
---|---|---|
研究代表者 | 秋山 祐樹 | 東京大学 空間情報科学研究センター |
研究分担者 | 左右田 敢太 | 東京大学 空間情報科学研究センター |
研究分担者 | 洪 義定 | 東京大学 空間情報科学研究センター |
研究分担者 | 徳冨 智哉 | 和歌山県データ利活用推進センター |
令和4年度
概要
空き家調査未完了の自治体だけでなく、完了済みの自治体においても、定期的に調査結果を更新していく必要があり、調査のたびに手間と費用が大きな負担となっていることから、自治体自身が容易に空き家分布の推定を行えるよう、これまでの研究で確立した空き家分布の推定手法をマニュアル化するとともに、推定結果を出力できるようにするためのツールを作成した。
研究体制
研究代表者・分担者の別 | 氏名 | 所属機関 |
---|---|---|
研究代表者 | 秋山 祐樹 | 東京大学 空間情報科学研究センター |
研究分担者 | 冨田 健人 | 東京大学 空間情報科学研究センター |
研究分担者 | 水谷 昂太郎 | 東京大学 空間情報科学研究センター |
研究分担者 | 山野寺 瞭太 | 東京大学 空間情報科学研究センター |
研究分担者 | 徳冨 智哉 | 和歌山県データ利活用推進センター |
令和5年度
概要
住民基本台帳等の自治体保有データを使用することなく、政府統計等のオープンデータのみを用いた空き家の長期将来推計が可能な機械学習モデルを開発した。
国勢調査の調査年度(2000年、2005年、2010年、2015年、2020年)と住宅・土地統計調査の調査年度(2003年、2008年、2013年、2018年)は調査年度に3年のラグがあり、この特性を生かし、国勢調査と住宅・土地統計調査のそれぞれの時点で3,8,13,18年後の予測モデルを作成した。空き家の発生メカニズムが大きく変化しないことを前提として、これらのモデルに数年先の国勢調査を外挿することで3年後、8年後、13年後、18年後の空き家率の推定値を算出することが可能となり、最長で2020年から18年後である2038年の空き家率の推計が可能となった。
分析結果
- 住宅・土地統計調査で結果が公表されていない人口1万5,000人未満の町村の結果も予測が可能となり、本研究の手法により、初めて和歌山県内の全ての自治体の今日及び将来の空き家率を明らかにすることができた。
- 8年後の空き家率を予測するモデルの精度検証を行った。2010年の日本全国で整備した説明変数に対して、8年後を予測するモデルを適用することで、2018年の自治体ごとの空き家率を予測した。そしてその結果と住宅・土地統計から得られる真値(正解値)の相関を見ることでその精度を検証した。相関係数は0.9012、決定係数は0.8122と両者の間には極めて強い相関があることが確認された。また、平均絶対誤差も約2%であり、多くの自治体において真値との差が非常に小さい値を得ることができるモデルが実現した。
- 同様に他の時点間においても精度検証を行い、何れの時点間においても予測精度、外挿精度ともに高いことが分かり、本研究で開発したモデルは統計的にも高い信頼性を有していることが確認された。
- 令和5年度研究成果報告書(PDF形式 2,206キロバイト)
研究体制
研究代表者・分担者の別 | 氏名 | 所属機関 |
---|---|---|
研究代表者 | 秋山 祐樹 | 東京都市大学 建築都市デザイン学部都市工学科 |
研究分担者 | 水谷 昂太郎 | 東京都市大学 総合理工学研究科建築・都市専攻都市工学領域 |
研究分担者 | 藤岡 裕大 | 和歌山県データ利活用推進センター |