[MGI27-P10] Minna de Honkoku: online transcription project of earthquake-related historical documents
キーワード:Historical earhtquake, Digital Humanities, Web application, Crowdsourcing
京都大学古地震研究会では,2017年1月に「みんなで翻刻【地震史料】」を公開した(https://honkoku.org/).「みんなで翻刻」は,Web上で歴史史料を翻刻するためのアプリケーションであり,これを利用した翻刻プロジェクトである.ここで,「みんなで」は,Webでつながる人々(研究者だけでなく一般の方をふくむ)をさしており,「翻刻」は,くずし字等で書かれている史料(古文書等)を,一字ずつ活字(テキスト)に起こしていく作業のことである.
古地震(歴史地震)の研究においては,伝来している史料を翻刻し,地震学的な情報(地震発生の日時や場所,規模など)を抽出するための基礎データとする.これまでに地震や地震に関わる諸現象についての記録が多数収集され,その翻刻をまとめた地震史料集(たとえば,『大日本地震史料』,『新収日本地震史料』など)が刊行され,活用されてきた.いっぽうで,過去の人々が残した膨大な文字記録のうち,活字(テキスト)になってデータとして活用しやすい状態になっている史料は,割合としてはそれほど大きくはない.未翻刻の史料に重要な情報が含まれている可能性もあるが,研究者だけですべてを翻刻するのは現実的ではない.
このような状況のなか,「みんなで翻刻【地震史料】」では,翻刻の対象とする史料を,地震に関する史料とし,東京大学地震研究所図書室が所蔵する石本コレクションから,114冊を選んだ.このコレクションを利用したのは,既に画像が公開されており権利関係がはっきりしていること,部分的には翻刻され公刊されているが,全部ではないこと,システム開発にあたって手頃なボリュームであること,過去の地震や災害に関係する史料なので興味をもってもらえる可能性があること,が主な理由である.
「みんなで翻刻【地震史料】」で翻刻できる史料のうち一部は,既刊の地震史料集にも翻刻が収録されている.しかし,ページ数の都合などにより省略されている部分も多い.「みんなで翻刻【地震史料】」によって,114冊の史料の全文の翻刻がそろうことにより,これまで見過ごされてきた情報を抽出できるようになる可能性がある.石本文庫には,内容の類似した史料が含まれていることが知られているが,全文の翻刻により,史料間の異同の検討などにより,これまでより正確に記載内容を理解できるようになるだろう.
「みんなで翻刻」では,ブラウザ上で動作する縦書きエディタを開発・採用して,オンラインでの翻刻をスムーズにおこなう環境を構築したほか,翻刻した文字数がランキング形式で表示されるなど,楽しみながら翻刻できるような工夫をしている.また.利用者どうしが,編集履歴や掲示板機能によって,翻刻内容について議論することができる.さらに,くずし字学習支援アプリKuLAと連携している.
正式公開後3週間の時点で,全史料114点中29点の翻刻がひととおり完了している.画像単位では3193枚中867枚(全体の27.2%)の翻刻がひととり完了している.総入力文字数は約70万字である.
未翻刻の文書を翻刻することがプロジェクトの主たる目的である.これに加えて,Web上で活動することにより,ふだん古文書や地域の歴史,災害史などに興味をもっていない層の方々が,古地震や古災害,地域の歴史に関する情報を届けるきっかけになると考えている.
謝辞:「みんなで翻刻【地震史料】」では,東京大学地震研究所所蔵の石本文庫の画像データを利用した.
古地震(歴史地震)の研究においては,伝来している史料を翻刻し,地震学的な情報(地震発生の日時や場所,規模など)を抽出するための基礎データとする.これまでに地震や地震に関わる諸現象についての記録が多数収集され,その翻刻をまとめた地震史料集(たとえば,『大日本地震史料』,『新収日本地震史料』など)が刊行され,活用されてきた.いっぽうで,過去の人々が残した膨大な文字記録のうち,活字(テキスト)になってデータとして活用しやすい状態になっている史料は,割合としてはそれほど大きくはない.未翻刻の史料に重要な情報が含まれている可能性もあるが,研究者だけですべてを翻刻するのは現実的ではない.
このような状況のなか,「みんなで翻刻【地震史料】」では,翻刻の対象とする史料を,地震に関する史料とし,東京大学地震研究所図書室が所蔵する石本コレクションから,114冊を選んだ.このコレクションを利用したのは,既に画像が公開されており権利関係がはっきりしていること,部分的には翻刻され公刊されているが,全部ではないこと,システム開発にあたって手頃なボリュームであること,過去の地震や災害に関係する史料なので興味をもってもらえる可能性があること,が主な理由である.
「みんなで翻刻【地震史料】」で翻刻できる史料のうち一部は,既刊の地震史料集にも翻刻が収録されている.しかし,ページ数の都合などにより省略されている部分も多い.「みんなで翻刻【地震史料】」によって,114冊の史料の全文の翻刻がそろうことにより,これまで見過ごされてきた情報を抽出できるようになる可能性がある.石本文庫には,内容の類似した史料が含まれていることが知られているが,全文の翻刻により,史料間の異同の検討などにより,これまでより正確に記載内容を理解できるようになるだろう.
「みんなで翻刻」では,ブラウザ上で動作する縦書きエディタを開発・採用して,オンラインでの翻刻をスムーズにおこなう環境を構築したほか,翻刻した文字数がランキング形式で表示されるなど,楽しみながら翻刻できるような工夫をしている.また.利用者どうしが,編集履歴や掲示板機能によって,翻刻内容について議論することができる.さらに,くずし字学習支援アプリKuLAと連携している.
正式公開後3週間の時点で,全史料114点中29点の翻刻がひととおり完了している.画像単位では3193枚中867枚(全体の27.2%)の翻刻がひととり完了している.総入力文字数は約70万字である.
未翻刻の文書を翻刻することがプロジェクトの主たる目的である.これに加えて,Web上で活動することにより,ふだん古文書や地域の歴史,災害史などに興味をもっていない層の方々が,古地震や古災害,地域の歴史に関する情報を届けるきっかけになると考えている.
謝辞:「みんなで翻刻【地震史料】」では,東京大学地震研究所所蔵の石本文庫の画像データを利用した.