Posted at
FOSS4GDay 18

考古学情報のオープン化ってどういうこと

01.JPG

考古学の世界では、毎年、大量の発掘調査報告書が刊行されています。こうした大量の報告書と、報告書作成に関わったバックデータの保存については文化庁を中心に議論が積み重ねられています。また、全国遺跡報告総覧は、発掘調査報告書のリポジトリとして22,596件の発掘調査報告書が登録されています(2018年12月6日現在)。


「報告書は紙」が原則

考古学情報の保存と公開について、文化庁の公式見解は「発掘調査報告書は今までどおり印刷物とする」(2017『埋蔵文化財保護行政におけるデジタル技術の導入について2』(報告),p22)というものです。電子メディアについては「印刷物の発掘調査報告書と同等以上の精度をもつ高精度PDFを、そのバックアップとして、当該発掘調査報告書を作成した組織が印刷物とともに保存する必要がある」として、バックアップには高解像度のPDFを用意するべきとしています。

Webでの情報公開には「低精度PDF」が有効であるとしています。


メディア論は本質ではない

保存・公開に用いられる媒体については、紙でもPDFでも考古学情報の本質としては、実は五十歩百歩です。考古学情報の公開にあたって解決しなければならないのは発掘調査報告のブラックボックス化です。考古学情報を再利用可能なデータ群にすることが考古学における情報化の最大の課題です。


発掘調査報告書とブラックボックス

発掘調査報告書の作成には現地で作成した図面、撮影された写真、測量記録などの一次情報のほかに、それらを整理・清書した中間的な二次情報が用いられます。例えば、最終的に報告書に掲載される遺物集計表は遺物の整理分類に使用された「遺物台帳」を元に作成されているはずです。しかし、最終的な報告書しか手にすることができない者にはこれらの集計作業が適切に行われたかどうかを判断するすべはありません。

また、現地で作成した平面図と断面図には必ず誤差が生じます。多くの場合、「素図」や「第二原図」などと呼ばれる清書図面を作成する際に、原図の修正作業が行われます。どのような修正が行われたのか、その修正は適切だったのかを知ることはできません。

下は筆者の手によって「つじつま合わせ」がなされた遺構図面。どのような修正が行われたのかは筆者のみが知る・・・

68747470733a2f2f71696974612d696d6167652d73746f72652e73332e616d617a6f6e6177732e636f6d2f302f36303433382f39616336393661362d363538372d643830302d643632392d6530313537316135323762342e6a706567.jpeg


修正も限度を超えると捏造

当然ですが、こうした「修正」作業は限度を超えると捏造と変わらなくなります。10cmの修正なら許されるのか、1mは許されないのか、こうした計測誤差を丸め込む合意は実は考古学にはありません。測量の世界では誤差を全体に散らして、総合的な誤差を「閉合誤差」のように定量化しますが、考古学でそのような取り扱いがなされているケースを私は知りません。

したがって、どのような修正が行われたのかがわかるようにしておくことが学問的な良心です。


発掘調査報告書の真正性

「真正性」(authenticity)とは聞き慣れない言葉ですが、「信憑性」というほどの意味になります。文化財の世界では「真正性」は、文化財の価値そのものと考えられている重要な概念です。

1994年に採択された「奈良文書」(1994「オーセンティシティに関する奈良文書」)では真正性について次のように述べています。


  1. オーセンティシティは、価値に関する本質的な評価要素である

  2. (文化遺産の価値を理解することは)価値に関する情報源が信頼できる度合いに依存する

  3. 文化遺産の特徴や変遷過程に関する知識と理解が、オーセンティシティの評価のためには必須である

たとえば、法隆寺が世界最古の木造建築であるという確かな証拠や、今の姿に至る修復や改変のプロセスが明らかとなっていることが法隆寺のオーセンティシティを保証し、価値を高めると考えます。「1500年前から建っている」といういい伝えよりも「1500年以上前の木材が使用されている年代測定結果がある」という学問的事実の方がオーセンティシティを高めるということです。


発掘調査報告書の作成プロセスを明らかにすること

文化遺産の真正性に関する評価はそのまま発掘調査報告書の評価にあてはまります。

すなわち


  1. 発掘調査報告書の価値はオーセンティシティによって評価される

  2. そのためには報告書作成に使用された情報源が信頼できる度合いが評価されなければならない

  3. どのようなプロセスで発掘調査報告書が作成されたのかに関する情報がオーセンティシティの評価には必須である

発掘調査報告書作成プロセスを明示することが、発掘調査報告書の真正性を評価するための第一歩となります。


データの長期保存とともに考えるべきこと

このような視点で発掘調査情報を考えたとき、単なる発掘調査データの長期保存を考えるだけでは不十分だということになります。


  1. 報告書作成プロセスをデータとして追跡できること

  2. 第三者が報告書を再構築できること

この2点を保証することによって発掘調査報告書の真正性の評価が可能になります。


Gitを利用した発掘調査データ管理

私がイメージする発掘調査報告書のデータ管理のイメージにもっとも近いのはGitを使ったバージョン管理とGitHubによるデータ共有です。

Gitの適切な使用によって、


  1. どのような改変が

  2. いつ

  3. 誰によって

行われたのかが明示的になります。

GitHubのようなデータ共有環境を利用することで、Gitによってバージョン管理されたデータ群を、誰でも利用できるようになります。

筆者らが取り組んでいる北海道南西部北斗市二股台場の測量調査ではGitHubによる調査情報の公開(https://github.com/IshiiJunpei/Futamata)を行っています。

02futamata.png


コンパイル状態の発掘調査報告書

発掘調査報告書というものは一種のコンパイル状態にあると考えられます。「コンパイル」とは、プログラミングコードをコンピュータが読むための2進法の記号に変換することです。コンパイルされたプログラムは人間には読めません。コンパイル状態の情報の真偽を問うことはもはや不可能ですし、使用されたコードを再利用することもできません。

紙媒体やPDF保存された発掘調査報告書も中身の情報の真偽を問うことやデータを再利用することが不可能、という点でコンパイルされた状態といえます。コンパイル状態の報告書からは最終的な結果を知ることはできますが、途中経過や再利用可能なデータを取り出すことは不可能です。


オープンソースとしての考古学情報

発掘調査報告書が適切なデータを使用して作成されているか、適切な手順を踏んで作成されているかを判断するためには、ソースコードに相当する一次情報や中間成果物にアクセスできる環境が必要です。発掘調査報告書の真正性は、すべての情報に市民がアクセスできる環境の構築によって保証されるものです。

オープンソースのソフトウェアのソースコードから必要な部分を切り取って自由に利用できるようになったことで、コンピュータソフトウェアの開発が大きく進んだのと同じく、考古学情報のオリジナルなデータを自由に切り取って利用できるようになる学問上のメリットははかりしれないものです。

全国遺跡報告総覧への報告書アップロードも十分とは言えない状態ですから、筆者のアイディアは時期尚早といえるかもしれません。しかし、自分が望む環境を自分で作り続けるという地道な取り組み以外に変化を起こす方法はないと信じています。