JpGU-AGU Joint Meeting 2017

講演情報

[EE] ポスター発表

セッション記号 M (領域外・複数領域) » M-GI 地球科学一般・情報地球科学

[M-GI27] [EE] Challenges of Open Science: Research Data Sharing, Infrastructure, and Scientific Communications

2017年5月23日(火) 15:30 〜 17:00 ポスター会場 (国際展示場 7ホール)

コンビーナ:村山 泰啓(国立研究開発法人情報通信研究機構統合ビッグデータ研究センター)、Toczko Sean(Japan Agency for Marine-Earth Science and Technology)、Cecconi Baptiste(LESIA, Observatoire de Paris, CNRS, PSL Research University)、Brooks Hanson(American Geophysical Union)、Kerstin Lehnert(Columbia University)、小口 高(東京大学空間情報科学研究センター)、近藤 康久(総合地球環境学研究所)

[MGI27-P10] Minna de Honkoku: online transcription project of earthquake-related historical documents

*加納 靖之1橋本 雄太2中西 一郎3大邑 潤三4天野 たま2久葉 智代4酒井 春乃5伊藤 和行2小田木 洋子3西川 真樹子6堀川 晴央7水島 和哉8安国 良一9山本 宗尚10 (1.京都大学防災研究所、2.京都大学大学院文学研究科、3.京都大学大学院理学研究科、4.佛教大学大学院文学研究科、5.京都大学文学部、6.国際日本文化研究センター、7.産業技術総合研究所、8.京都大学大学院経済学研究科、9.住友史料館、10.賀茂県主同族会)

キーワード:Historical earhtquake, Digital Humanities, Web application, Crowdsourcing

京都大学古地震研究会では,2017年1月に「みんなで翻刻【地震史料】」を公開した(https://honkoku.org/).「みんなで翻刻」は,Web上で歴史史料を翻刻するためのアプリケーションであり,これを利用した翻刻プロジェクトである.ここで,「みんなで」は,Webでつながる人々(研究者だけでなく一般の方をふくむ)をさしており,「翻刻」は,くずし字等で書かれている史料(古文書等)を,一字ずつ活字(テキスト)に起こしていく作業のことである.

古地震(歴史地震)の研究においては,伝来している史料を翻刻し,地震学的な情報(地震発生の日時や場所,規模など)を抽出するための基礎データとする.これまでに地震や地震に関わる諸現象についての記録が多数収集され,その翻刻をまとめた地震史料集(たとえば,『大日本地震史料』,『新収日本地震史料』など)が刊行され,活用されてきた.いっぽうで,過去の人々が残した膨大な文字記録のうち,活字(テキスト)になってデータとして活用しやすい状態になっている史料は,割合としてはそれほど大きくはない.未翻刻の史料に重要な情報が含まれている可能性もあるが,研究者だけですべてを翻刻するのは現実的ではない.

このような状況のなか,「みんなで翻刻【地震史料】」では,翻刻の対象とする史料を,地震に関する史料とし,東京大学地震研究所図書室が所蔵する石本コレクションから,114冊を選んだ.このコレクションを利用したのは,既に画像が公開されており権利関係がはっきりしていること,部分的には翻刻され公刊されているが,全部ではないこと,システム開発にあたって手頃なボリュームであること,過去の地震や災害に関係する史料なので興味をもってもらえる可能性があること,が主な理由である.

「みんなで翻刻【地震史料】」で翻刻できる史料のうち一部は,既刊の地震史料集にも翻刻が収録されている.しかし,ページ数の都合などにより省略されている部分も多い.「みんなで翻刻【地震史料】」によって,114冊の史料の全文の翻刻がそろうことにより,これまで見過ごされてきた情報を抽出できるようになる可能性がある.石本文庫には,内容の類似した史料が含まれていることが知られているが,全文の翻刻により,史料間の異同の検討などにより,これまでより正確に記載内容を理解できるようになるだろう.

「みんなで翻刻」では,ブラウザ上で動作する縦書きエディタを開発・採用して,オンラインでの翻刻をスムーズにおこなう環境を構築したほか,翻刻した文字数がランキング形式で表示されるなど,楽しみながら翻刻できるような工夫をしている.また.利用者どうしが,編集履歴や掲示板機能によって,翻刻内容について議論することができる.さらに,くずし字学習支援アプリKuLAと連携している.

正式公開後3週間の時点で,全史料114点中29点の翻刻がひととおり完了している.画像単位では3193枚中867枚(全体の27.2%)の翻刻がひととり完了している.総入力文字数は約70万字である.

未翻刻の文書を翻刻することがプロジェクトの主たる目的である.これに加えて,Web上で活動することにより,ふだん古文書や地域の歴史,災害史などに興味をもっていない層の方々が,古地震や古災害,地域の歴史に関する情報を届けるきっかけになると考えている.

謝辞:「みんなで翻刻【地震史料】」では,東京大学地震研究所所蔵の石本文庫の画像データを利用した.