[MGI41-15] 歴史的行政区域データセットβ版をはじめとする幾何データ共有サイト「Geoshape」の構築
キーワード:幾何データ、行政区域、データセット、GeoJSON、ベクトルタイル、エンティティベース地理情報システム
1. はじめに
地理情報を統合するには大別して2つのアプローチがある。第一が緯度経度などの座標系にアドレスを数学的に定義するアプローチ、第二が地物などのエンティティのデータベースを基にアドレスを列挙するアプローチであり、本研究は後者に焦点を合わせる。エンティティとは、固有IDとそれに紐づく複数の属性情報として表現される単位である。この場合、点やポリゴンなどの幾何データ(座標情報)は属性情報の一つに含まれるものの、統合の単位はあくまで固有IDとなる。我々はエンティティベース地理情報システムの構築を目指し、エンティティを抽出するGeoNLP(https://geonlp.ex.nii.ac.jp/)、エンティティのLinked Dataを構築するGeoLOD(http://geolod.ex.nii.ac.jp/)に続き、エンティティの幾何データを共有するGeoshape(http://geoshape.ex.nii.ac.jp/)を公開した。
2. 幾何データ形式の変遷
幾何データの共有には、以前からシェープファイル形式とGML(Geography Markup Language)形式が用いられてきた。しかし、これらはウェブ技術のトレンドに適合していないため、我々はその代わりに、JSONの一種であるGeoJSONやTopoJSONを活用することとした。GeoJSONは点、線、ポリゴンなどのエンティティの形状と属性を記述できる。またTopoJSONは、GeoJSONの座標表現を効率化し、塗り分け地図(コロプレス地図)などへの利用も想定している。
近年はさらにデータアクセスを効率化するベクトルタイル形式が普及を始めている。ベクトルタイル形式は、ラスター型地図では標準となったタイル化の概念をベクトル型地図に導入し、ブラウザ上でリアルタイムにレンダリングするために必要なタイルだけを取得する。これにより、表示が高速化でき、描画スタイルをブラウザ上で変更できるなどのメリットが生まれる。我々は、ベクトルデータをProtocol BuffersによってバイナリエンコードしたMapbox Vector Tile 形式を採用することにした。
3. 歴史的行政区域データセットβ版の構築
幾何データとして特に需要が大きいのは市区町村の行政区域データである。その理由は、市区町村が地理情報の単位として多用されるだけでなく、住民の日常生活や歴史の記憶とも結びついていることにある。明治から平成までの大合併ごとに市区町村の数は減少してきたが、かつての市区町村の記憶は今も重層的に残っている。ゆえに、現在から過去に至る情報を統合するには、行政区域の歴史的な変遷を追跡可能なデータセットが必要となる。
そこで我々は、国土交通省が公開する「国土数値情報 行政区域データ」を典拠として行政区域の変遷を構造化および可視化するウェブサイト「歴史的行政区域データセットβ版」を2017年1月に公開した。このデータセットは1920年から2019年まで27時点の行政区域をポリゴンデータとして提供するだけでなく、幾何計算に基づき行政区域の隣接や重なりに関する情報をまとめている。また市区町村役場や公的集会施設データを参照し、ポリゴンに含まれる行政施設を代表点に設定することで、ポリゴンの代表点として意味のある場所を選べるようにした。
さらに過去から現在に至る行政区域を一意に特定する固有IDを定義した。総務省(当時:自治省)が設定する全国の都道府県及び市区町村のコードは、1968年以降の行政区域には利用できるが、それ以前に消滅した行政区域には利用できないという問題がある。そこで、1968年以前と以降で固有IDの名前空間を分割し、以前の行政区域には独自の新しいIDを付与するアルゴリズムを開発することで、すべての行政区域に固有IDを付与することができた。
4. 幾何データ共有サイトGeoshape
歴史的行政区域データセットを手始めに、Geoshapeサイトでは様々な幾何データを共有する計画である。例えばe-Statが提供する「町丁・字等別境界データ(2015年)」を使えば、より細かいスケールの境界データを活用できるようになる。さらに歴史的行政区域データセットと町丁・字等別境界データを組み合わせてベクトルタイル化することで、日本全国の行政区域を市区町村から町丁・字へと継ぎ目なくズームイン可能なサービスを2020年2月に公開した。そして両者のポリゴンの重なりを計算することで、現在の町丁・字が歴史的にどの市区町村に属していたかも簡単に調べられるようにした。
Geoshapeでは、河川データや気象データなど幾何データの種類を拡大中であり、それらをエンティティ単位で検索・可視化・統合する機能も順次追加している。今後はエンティティベースの地理情報ハブとして成長させていきたいと考えている。
謝辞
本研究は、ROIS-DS公募型一般共同研究ROIS-DS-JOINT 020RP2018および035RP2019(代表:村田 健史)の支援を受けました。
地理情報を統合するには大別して2つのアプローチがある。第一が緯度経度などの座標系にアドレスを数学的に定義するアプローチ、第二が地物などのエンティティのデータベースを基にアドレスを列挙するアプローチであり、本研究は後者に焦点を合わせる。エンティティとは、固有IDとそれに紐づく複数の属性情報として表現される単位である。この場合、点やポリゴンなどの幾何データ(座標情報)は属性情報の一つに含まれるものの、統合の単位はあくまで固有IDとなる。我々はエンティティベース地理情報システムの構築を目指し、エンティティを抽出するGeoNLP(https://geonlp.ex.nii.ac.jp/)、エンティティのLinked Dataを構築するGeoLOD(http://geolod.ex.nii.ac.jp/)に続き、エンティティの幾何データを共有するGeoshape(http://geoshape.ex.nii.ac.jp/)を公開した。
2. 幾何データ形式の変遷
幾何データの共有には、以前からシェープファイル形式とGML(Geography Markup Language)形式が用いられてきた。しかし、これらはウェブ技術のトレンドに適合していないため、我々はその代わりに、JSONの一種であるGeoJSONやTopoJSONを活用することとした。GeoJSONは点、線、ポリゴンなどのエンティティの形状と属性を記述できる。またTopoJSONは、GeoJSONの座標表現を効率化し、塗り分け地図(コロプレス地図)などへの利用も想定している。
近年はさらにデータアクセスを効率化するベクトルタイル形式が普及を始めている。ベクトルタイル形式は、ラスター型地図では標準となったタイル化の概念をベクトル型地図に導入し、ブラウザ上でリアルタイムにレンダリングするために必要なタイルだけを取得する。これにより、表示が高速化でき、描画スタイルをブラウザ上で変更できるなどのメリットが生まれる。我々は、ベクトルデータをProtocol BuffersによってバイナリエンコードしたMapbox Vector Tile 形式を採用することにした。
3. 歴史的行政区域データセットβ版の構築
幾何データとして特に需要が大きいのは市区町村の行政区域データである。その理由は、市区町村が地理情報の単位として多用されるだけでなく、住民の日常生活や歴史の記憶とも結びついていることにある。明治から平成までの大合併ごとに市区町村の数は減少してきたが、かつての市区町村の記憶は今も重層的に残っている。ゆえに、現在から過去に至る情報を統合するには、行政区域の歴史的な変遷を追跡可能なデータセットが必要となる。
そこで我々は、国土交通省が公開する「国土数値情報 行政区域データ」を典拠として行政区域の変遷を構造化および可視化するウェブサイト「歴史的行政区域データセットβ版」を2017年1月に公開した。このデータセットは1920年から2019年まで27時点の行政区域をポリゴンデータとして提供するだけでなく、幾何計算に基づき行政区域の隣接や重なりに関する情報をまとめている。また市区町村役場や公的集会施設データを参照し、ポリゴンに含まれる行政施設を代表点に設定することで、ポリゴンの代表点として意味のある場所を選べるようにした。
さらに過去から現在に至る行政区域を一意に特定する固有IDを定義した。総務省(当時:自治省)が設定する全国の都道府県及び市区町村のコードは、1968年以降の行政区域には利用できるが、それ以前に消滅した行政区域には利用できないという問題がある。そこで、1968年以前と以降で固有IDの名前空間を分割し、以前の行政区域には独自の新しいIDを付与するアルゴリズムを開発することで、すべての行政区域に固有IDを付与することができた。
4. 幾何データ共有サイトGeoshape
歴史的行政区域データセットを手始めに、Geoshapeサイトでは様々な幾何データを共有する計画である。例えばe-Statが提供する「町丁・字等別境界データ(2015年)」を使えば、より細かいスケールの境界データを活用できるようになる。さらに歴史的行政区域データセットと町丁・字等別境界データを組み合わせてベクトルタイル化することで、日本全国の行政区域を市区町村から町丁・字へと継ぎ目なくズームイン可能なサービスを2020年2月に公開した。そして両者のポリゴンの重なりを計算することで、現在の町丁・字が歴史的にどの市区町村に属していたかも簡単に調べられるようにした。
Geoshapeでは、河川データや気象データなど幾何データの種類を拡大中であり、それらをエンティティ単位で検索・可視化・統合する機能も順次追加している。今後はエンティティベースの地理情報ハブとして成長させていきたいと考えている。
謝辞
本研究は、ROIS-DS公募型一般共同研究ROIS-DS-JOINT 020RP2018および035RP2019(代表:村田 健史)の支援を受けました。