2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

History TechAdvent Calendar 2024

Day 6

くずし字判読OCRは、生成AIと組み合わせて使うとよさそう

Last updated at Posted at 2024-12-08

くずし字判読OCRの台頭

くずし字で書かれた古文書を判読するのに、くずし字判読OCRが登場してきています。
主なものだけでも、

これらはくずし字の知識のない人たちが、古文書に触れる機会を助けてくれる画期的なものですが、しかし実際のところ、使ってみると期待したほどの自由な世界が広がっているわけではなく、厳しい現実が目の前に立ちはだかります。
OCRには付き物の、誤認識の問題です。

現代語のOCRであれば、誤変換は一目瞭然なので後で修正可能ですが、くずし字OCRは元々わからないものをOCRに託しているので、誤変換があっても修正できません。
さらに、候文で書かれた変換結果を相手にたいていの人は文脈を解釈するのも大変なので、コンテキストから修正するのもとても大変です。
結果、正解してるのか間違いかもわからない、テキストの羅列が生成されて、その先をあきらめがちです。

機械学習、生成AI系ソリューションの多段処理の可能性

筆者は以前、英語の動画のAI文字起こしをダウンロードしてみたら、文章になっていない判別結果で困ったことがありました。
が、ふと思い立ち、生成AIにこの文字起こしを食べさせて、プロンプトに「この文章は動画のAI文字起こしです。自動文字起こしのため、誤判定が多く含まれ、文章として意味をなしていません。その誤判定の可能性を推測しつつ、文章を再構成し、さらに日本語訳してください」と依頼したところ、(少なくとも内容と、筆者自身が持っている知識と比較した上では)完全に正しい日本語を出してきたのです。

この経験が役立つのではないか?と思い、くずし字判読OCRの判読結果を、生成AIに処理させたところ、かなり正確と思われる翻刻文、(漢文や宣命体の部分は)読み下し文、口語文を生成してくれました。
生成AIはIPS細胞のような万能プレーヤーなので、つい生の元データから、最終的に求める結果を出してくれるワンストップチャネル的な動きを求めてしまいがち1ですが、なんでもできる仕組みを作るより、得意分野のあるAIを多段に組み合わせて使う方が有効なのではないか、という仮説を今筆者は持っています。

保井文庫「奈良しぐれ」の口語訳実施

システムの選定

実際の効果を判定するのに、現在に至るまで翻刻、口語訳が表に出ていない、天理図書館所蔵の、保井文庫奈良しぐれという地誌を、試しに口語訳してみました。
この地誌は全6巻からなりますが、そのうち第1巻は失われ、春日大社に関する記述があったと推測されるので、後から他の地誌から春日大社の記述を持ち込んで1巻として補ったという経緯があり、その意味で本来の記述ではありません。なので、2巻のうち、最初の3分の1ほどを処理対象としました2

多段処理させるにあたり、くずし字OCRと生成AI双方にいくつかの選択肢がありますが、まずくずし字OCRはNDLの古典籍OCR-Liteを用いました。理由はスマホ版だけでなくWindows版があったためまとめて処理させるのに都合がよかったということもありますが、なにより変換精度が抜群に良かった点が挙げられます。飽くまで外形的な推測ですが、他の2つのくずし字OCRは字形を元にした判定で、文脈などは考慮していないか限定的な材料にしかしていなさそうなのに対し、古典籍OCR-Liteはコーパスなどを用いてかなり文脈も考慮した判別になっている感じがしました。

続いて生成AIですが、Claudeの3.5 Sonnetを採用しました。
比較対象としたのはChatGPTのGPT-4o、GeminiのAdvanced(1.5 Pro)ですが、以下の観点で選択しました。

  • 今回必要なのは抄訳ではなく全訳処理ですが、何度か「本当に全訳ですか?」と確認する前の、初手で一番全訳に近い結果を出してきたのがclaude.aiだった
  • 今回、OCRミスを推定して修正するのもタスクの一部ですが、OCRの段階で、ちょうどそこでページが変わっていたこともあり、「和銅」「七年」が「和尚」「七年」と判別されてしまっていたケースがありました。これに対し、正しく「和銅七年」と解釈したのはClaudeだけで、Geminiは和尚を無視、七年は7歳と翻訳したために「七歳の時、十四歳で皇太子に立てられ」と意味の分からない結果を返し、ChatGPTは和尚も七年も無視しました

実行させたプロンプト

ここまでで、古典籍OCR-Liteで出した判別結果を、Claudeで処理させるという方針が決まりました。
テキストの判別結果を生成AIに与えてもよかったのですが、古典籍OCR-Liteは文書中の解析位置をメタ情報として持つXMLなどの出力方法もありますので、蔵書印やシミの誤判定判断を生成AI自体にさせるという意味でも、XMLを生成AIに与えることにしました。

初手で与えたプロンプトはこうです。

奈良の地誌をくずし字OCR APIで翻刻した結果を添付していきます。
全部で6巻ある地誌ですが、そのうちの2巻をOCRした結果です。
全部で47ページありますが、5ページずつ添付していきますので、コンテキストを引き継ぎつつ、随時解析していってください。

当然OCRですので、判別ミスが存在しています。 しかし、人間が見る限り、判別精度はそこそこよいです。
この判別結果を基に、判別ミスも考慮に入れて、

  • 想定される「正確な」翻刻
  • それを口語訳した、正確な口語訳文

を生成してください。

注意として、OCR翻刻結果は、テキストではなくXMLで提供しています。 そのため、ページ内のどの辺の座標に記された文章かの情報があります。可能であればそれを用いて、不要な情報(たとえば蔵書印や、シミの誤変換)を削除してください。
ファイルの順序は、ファイル名から推測してください。

また、作業手順の中で、やり取りを通じて以下のような指示を適宜、追加で与えていきました。次回他の巻を作業する際には、当初から与えるべき指示に入るでしょう。

ページの切り替わりの部分で、後のコンテキストが追加されたために判断が変わる場合は、その部分を翻刻/口語訳し直してください。

ここまでの部分にあったかわかりませんが、この地誌の特徴として、ページに付箋が張り付けられているものがあり、その場合、まず付箋以外のところのページがスキャンされており、その後に付箋をページに重ね合わせてスキャンしています。
そのスキャン結果をOCRしていますので、結果的に、そのような場所のOCRでは、前のページとほぼ同じ判読結果が続きながら、途中で単発の付箋上の文が解析されるようなデータ形式になると思われます。
そのような場合は、2度同じ内容が訳されないようにしつつ、付箋上の情報と思われる記述を、文脈上適切な場所に、付箋情報として埋め込んでください。

*抄訳ではなく全訳(付箋などで重複部分を除き、全部の文字を省略せず解釈する)
*()内は注釈、《》内は付箋情報
*漢文、宣命体については、翻刻、口語訳だけでなく、書き下しも含める
*寸法や数量に関する部分は、できるだけ現代の単位に換算して補足説明を加える
の徹底をお願いします。

このようなやり取りを通じて、くずし字OCR結果から翻刻文、口語訳文を取得できました。

生成AI側からの逆提案

また、こちらからプロンプトを与えるだけではなく、生成AI側からの逆提案を受けることもありました。
もちろん、生成AIにはハルシネーションの問題がありますから、こういった提案を受け入れてそのまま追加情報としてよしとするのではなく、実際に正しいか検証する作業は人間にゆだねられますが、生成AIが翻刻、翻訳部分だけではなく、監修部分にも一定程度役割を果たせる可能性を示しています。

今回は提案に対し、単位換算のように容易に口語訳文中に埋め込めるものは依頼しつつも、注釈的にしなければならないものは後でまとめて依頼するとしてスキップいたしました。
以下は逆提案の例です。

寸法や数量に関する部分は、できるだけ現代の単位に換算して補足説明を加えることも可能ですが、いかがいたしましょうか?
...
(注:寸法の現代単位への換算は、1尺を約30.3cm、1丈を約3.03m、1寸を約3.03cm、1分を約3.03mmとして概算しています)

宣命は、漢字と宣命書きの仮名を交えた特殊な表記で書かれており、その解読と現代語訳を提供すべきでした。
...
これは漢文や疑似漢文ではなく、宣命体(せんみょうたい)と呼ばれる特殊な文体です。
宣命体は、奈良・平安時代に朝廷の公式文書で使用された独特の文体で、以下の特徴があります:

  • 和文を基本としながら漢字を交えて表記
  • 助詞や助動詞を小字(こじ)で表記
  • 漢字は訓読みが基本
  • 和語の語順で書かれる

したがって、漢文の書き下し文というよりも、宣命体から現代語への翻訳という形になります。
...
宣命体は、天皇の言葉を臣下に伝える、または臣下の言葉を天皇に伝えるための公式な文体として使用されました。小字(こじ)で書かれる助詞や助動詞は、原文では「の」「に」「を」などが小さく書かれ、漢字で書かれた本文の脇に添えられていたと考えられます。
この宣命の内容は、奥州での黄金発見を盧舎那仏(大仏)の御前で報告し、それを仏の加護による慶事として捉え、感謝の意を表明するものとなっています。

(以下の注釈を省略していたので追加提供するかの提案)

  • 「だだみ経」を「畳経」と解釈しただけで、その具体的な説明を省略
  • 「金鐘寺」の位置づけや意味の説明を省略
  • 「鎧谷」の具体的な説明を省略
  • 役職名(例:「員外介」)の詳しい説明を省略
  • 「銀青光禄大夫」の位の説明を省略

開眼供養の儀式に関わる様々な役職(維那、錫杖衆、預師、散華師など)の詳しい説明や、仏具(鎗石香炉など)の具体的な解説が必要でしたら、追加で提供させていただきます。

この部分は漢文ではなく、サンスクリット語の音写(漢字で音を写したもの)であると考えられます。
「南談(なむ)」から始まっているので、おそらくマントラ(真言)の一種と思われます。「阿梨耶」(ārya)は「聖なる」、「波盧枳帝」(avalokita)は「観」に関係する音写で、観音菩薩への帰依文の一部である可能性が高いと考えられます。

実際に生成された『奈良しぐれ2巻』の口語訳文(一部)

以下に、実際に生成された『奈良しぐれ2巻』の口語訳文の一部を示します。
翻刻文も本来は出したかったのですが、天理図書館から奈良しぐれのスキャン結果を入手した際に、翻刻文、書き下し文までは、公開を天理図書館に伝えたうえ、適当な対価を払わなければ表に出せない決まりになっておりますので、今回は公開できません。
口語訳についてはDon't Careという決まりですので、口語訳のみ、今回の作業でできた部分を以下に示します。

奈良時雨(ならしぐれ)

今日もまた東大寺の盧舎那仏を拝もうと思い、いつものように反り橋を渡って飛火野を通り過ぎていくと、大仏が近くに見えてきた。まず、この大仏殿は、東大寺大華厳寺、または常説華厳寺、城大寺、総国分寺、あるいは金光明四天王護国寺などと呼ばれている。

そもそもこの寺は、奈良時代の第三代天皇、すなわち第45代聖武天皇の発願によるものである。天皇の諱を天皇国押開覚桜彦命という。第42代文武天皇の皇子であり、和銅7年に14歳で皇太子となり、天皇位についておよそ25年が経った。

その頃、天皇に深く帰依していた僧侶に良弁僧正という、智慧と行いにおいて非の打ち所のない人物がいた。生まれは相模国の人であった。その母は適齢期を過ぎても子供に恵まれなかったため、観音に祈願して良弁を授かった。良弁が2歳の時、母が桑を摘んでいる間、その木陰に子供を座らせていたところ、思いがけず鷲が現れて子供をさらっていった。母は「ああ」と叫びながら追いかけたものの、鷲の翼は速く、あっという間に飛び去り、その鷲は奈良の都まで飛んで行き、大きな杉の空洞に子供を置き去りにした。

その頃、南都の義渕僧正という人物が春日大社に参拝する途中、この子を見つけて拾い上げ、育てることにした。良弁は5歳の頃には一つ教えると十を理解するほど賢く、後に桐家に入って華厳経の深い教えを会得したため、皆から「華歳良介」と呼ばれるようになった。その杉の木は今も二月堂の下に残っている。

その後、成長して高い木の下に草庵を結び、岩のそばに石の座席を設けて執金剛神の像を安置し、自らを金鷲仙人と名乗って、都に向かって金輪聖王(天皇)の天長地久を唱え続けた。その声が遠くまで響き、不思議な悟りの気配がある時、紫の雲が空に広がり、金色の光が神像の目から宮殿を照らしました。天皇は不思議に思われ、側近たちも驚いて、そこへ使者を送って事の次第を尋ねさせたところ、仙人がありのままを申し上げたので、天皇は行幸してともに還御することとなり、その威勢は並々ならぬものでした。そして[仙人を]師として仰ぎ慕われたのでした。

天皇がこれを拝見されてからこの事を思い立たれたという説もありましたが、東大寺勧進所大仏殿の縁起には前述の説のみが記されています。

またその頃、行基僧正という帰依の深い僧がおりました。天皇に申し上げるには、「神々の力なくしてはこの計画は叶いがたいでしょう。天照大神に参って祈願をすべきです」と言って、伊勢国の五十鈴川上の神社の近くに居を構えて七日七夜祈念することにしました。「神は古くから衆生を救済するためにこの地に跡を残され、私は釈迦の分身の弟子として他者を教化し救済するために七度もこの世に生まれてきました。持参した仏舎利一粒を奉納いたしますので、どうかお受け取りくださり、願いを成就させてください」と申し上げると、大神宮が夢の中に現れて示現がありました。

「私は抑えがたい大願を受け入れ、
また、受け難い宝珠をお受けいたしました。
聖武天皇の大仏殿建立は、
まさにふさわしい安寧をもたらすものです。
それはあたかも暗闇で灯りを得たようであり、
海を渡るのに船を得たようなものです。」

行基菩薩は夢から覚めて喜びの涙を流し、飯高郡の地中に舎利を納めて都に戻り、この事を奏上しました。そして奥州では砂金を、勢路(伊勢路)では水金を、信州では赤銅を集めました。これは神明の冥助であったと勧進所の縁起に記されています。

別の説では、僧侶を使者として神に参らせることは神国の道理に反するとして、重ねて右大臣橘公を勅使として派遣されました。また豊前国宇佐郡の八幡宮にも勅使を立てられました。両社からの神託が天皇の意向に適ったため、天平15年10月15日、近江国の繁香楽宮において盧舎那大仏を造ることを決められ、同17日に寺地の開基が行われました。

行基菩薩は勅命を受けて全国の貴賤の人々に寄進を勧めました。その発願の文書は天皇自らの御筆による賢明な勅命でした。同16年11月、近江国の甲賀寺で四大寺の僧たちが集まり、音楽を奏で、骨組みを立てて大仏の形を作ろうとしました。天皇自らその縄を引かれましたが、事は成就せず、同17年4月に奈良の都に還幸され、同年8月23日、改めて大仏を鋳造することになりました。天皇が涙を袖に包んで座られると、民衆に至るまですべての人々が同じように涙を流したということです。

縁起によると、天平18年、大仏の像を鋳造することは7度に及んでも完璧な形にならなかったため、天皇は深く悩まれ、あるいは天魔の妨げによるものか、または鋳物師の技術が未熟なためかと考えて、諸国に勅使を派遣して優れた鋳物師を探させました。

勅使が美濃国の雄総という所に到着すると、子供たちが牛に草を食べさせていました。その中に一人の不思議な少年がいて勅使を怪しんだので、「私は奈良の天皇の使いで、16丈の仏像を鋳造できる優れた鋳物師を探しているのだ」と答えると、少年は杖を持って遠くの川原の砂に、相好円満な(完璧な容姿の)盧舎那仏の姿を一町ほどの大きさで描いて見せました。勅使は感嘆して少年を連れて帰り奏上したところ、天皇は感心され、従五位の位を授けられました。

この少年は、これによって雄総寺という寺を建立し、金銅の観音像を安置して、大仏造立の成功を祈願したといいます。同年10月、天皇と元正上皇、光明皇后が金鐘寺に行幸され、大仏の供養会が行われた際には、仏像の前後に一万五千七百余りの灯明が掲げられました。

天平勝宝元年、大仏を鋳直すことになった時、かの少年は「仏や天の助力なくしては陛下の大願は成就し難いでしょう。一万人の僧侶を招いて法会を執り行うべきです」と奏上しました。そのとおりにと大法会が執り行われると、空から光が差して、二十五人の鋳物師が現れ、かの少年と共に鋳造を始めました。ところが本尊の髪の部分の銅が足りなくなり、どうしようかと相談していた時、少年は「一万人の僧侶の柄香炉を五百枚の畳経の中に投げ入れれば、ちょうど良い量になるでしょう」と申し出ました。皆がそれに従って投げ入れると、不足することなく願い通りに鋳造することができました。空からの光は龍寺の観音の眉間から放たれた金色の光でした。

その日の不思議はこれだけではありませんでした。二十五人の鋳物師は仕事を終えると、大仏殿の後ろの玄武山から飛び立って西へ向かって去っていきました。これは阿弥陀如来の聖衆菩薩たちが朝廷を助けに来てくださったのです。その後、この山に社を建てて二十五所の明神として祀られました。かの少年は千手観音の化身となって東へ向かって消えたと縁起に記されています。

正式な鋳物師として、従五位下の柿本男玉、同じく高市真国、同じく高市奥麿、そして大仏師として従四位下の国公麿が任命されました。これ以降の大仏修理の際、適切な技術を持つ工人がいない時、この公麿という優れた技術を持つ人物が最後まで鋳造を成し遂げました。この功績により四位に昇進し、造東大寺の次官と但馬の員外介を兼ねる職を与えられました。宝字2年には、大和国葛下郡国中村に住んでいた者であることから、「国」という氏を賜り、それ以来、国公麿と呼ばれるようになったのです。

大仏の鋳造が終わり、仏像の表面を金メッキすべく黄金を集めようとしましたが、当時の日本にはまだ黄金が乏しい状態でした。天皇は和州の金峯山の金剛蔵王に祈願して山中の黄金を得て金メッキの助けとしようと、良弁僧正に勅命を下して丹誠を込めて祈らせました。良弁は像を安置して如意輪観音の法を修して黄金を祈願しました。これが今の石山寺の起源です。

それからほどなく、天平21年2月に奥州で金山が発見され、金が献上されました。天皇は大変喜ばれ、天平という年号に「勝宝」の二字を加えて改元されました。この時、大伴中納言家持が祝意を込めて万葉集に「皇の御代が栄えるしるしとして、東国の陸奥の山に黄金の花が咲いた」という歌を詠みました。

天皇が大仏の前に行幸されて拝礼なさった際、晦日に橘宿祢葛城王が宣命を読み上げました。
「日本の三宝(仏・法・僧)に仕え奉る天皇の宣命を、平等盧舎那仏(大仏)の御前に謹んで奏上申し上げます。
この大和の国は、天地開闢以来、黄金が産出する国ではなく、この地には黄金はないものと思われていたところ、お聞き及びになった国内の東方、陸奥国の国守である従五位上百済王敬福の管轄する郡内で黄金が発見されたとの報告がございます。
この献上を天皇がお聞きになり、驚きと共に大いにお喜びになられましたが、これもひとえに盧舎那仏の慈悲により授かった福徳の効験であると思し召され、ありがたくお受け取りになりました。恐れながら、百官の者たちを率いて礼拝を捧げることは、この畏れ多き三宝の御前で、おそれ多くも申し上げることをお許しください。」
さらに奥州の守から黄金九百両が追加で献上され、この功績により敬福は銀青光禄大夫の位を授けられたと元亨釈書に記されています。

縁起によると、伊賀国から材木を運ぼうとした際、泉川の上流に三四町(約300-400メートル)ほどの岩山が川をふさぎ、水が岩の下を潜って流れていたため、筏も材木も通すことができませんでした。朝廷でこの問題が議論された時、良弁は岩屋に籠もって功徳の成就を祈ったところ、空から雷神が降りてきて岩山を砕き、道を開いてくれたので、材木を運ぶことが容易になりました。砕けた岩山の一つは流れに留まって瓶原にあり、これが流岡と呼ばれています。もう一つの山は山城の国の中へ流れ下って、飯岡と呼ばれています。

諸国に命じて人民や牛馬を集めて材木を運ばせようとしたところ、力士が牛に姿を変えて自然に現れ、材木を自在に運びました。これは真に大日如来の化身であったと言われています。また、久米の郷の人夫が寺の建設現場にやってきました。仮造寺の役人である太宰師の佐伯宿称今毛人は、良い相師であったのですが、この人夫を見て「お前は普通の人ではない。仏の影響を受けて来た権化ではないか」と問いただすと、その人夫は恥ずかしそうな様子でその場を去り、ひそかに護法の天衆を招請したところ、柱がたちまち空中に飛び上がって造営地に運ばれました。これを見聞きした人々の喜びは限りないものでした。

大仏殿建立のため諸国へ勅使を派遣して技術者を召集されると、空から五百人の阿羅漢が飛来し、遠近の各地に赴いて鍛冶職人や大工の姿で現れ、寺の建立が終わった後、当寺の真言院の山へ飛び移って西へ去っていきました。その岡には社が建てられ、五百余所明神として祀られ、今でも霊験あらたかです。

盧舎那大仏の身体の寸法と鋳造に関する詳細は、朝野群載に次のように記されています:
大仏は結跏趺坐(けっかふざ:足を組んで座る姿勢)の状態で、高さは五丈三尺五寸(約16メートル。ただし続日本紀では五丈、釈書では十六丈と記録が異なります)、
顔の長さは一丈六尺(約4.8メートル)、
幅は九尺五寸(約2.9メートル)、
眉の長さは五尺四寸五分(約1.65メートル)、
目の長さは三尺九寸(約1.2メートル)、
口の長さは七寸(約21センチメートル)、それぞれの高さ一尺(約30センチメートル)、
顎は一尺六寸(約48センチメートル)、
耳の長さは八尺五寸(約2.6メートル)、
頭の長さは二尺六寸五分(約80センチメートル)、
肩幅は二丈八寸七分(約6.3メートル)、
胸の長さは一丈九尺(約5.7メートル)、
脇の長さは一丈三尺(約3.9メートル)、
腕の長さは一丈九尺(約5.7メートル)、
手のひらの長さは五尺六寸(約1.7メートル)《付箋注:時を経て腕が長くなっている》、
また五尺(約1.5メートル)、
中指の長さは五尺(約1.5メートル)、
脛の長さは二丈三尺八寸五分(約7.2メートル)、
膝の前の径は三丈九尺(約11.7メートル)、
膝の厚さは七尺(約2.1メートル)、
足の下部は一丈三尺(約3.9メートル)でした。

鎧の谷は三尺三寸(約1メートル)、
銅座の高さは一丈八尺(約5.4メートル)、
周囲は二十一丈四寸(約64.2メートル)、
基礎部分の周囲は十三丈九尺(約42メートル)、
石座の高さは八尺(約2.4メートル)、
上部の周囲は三十四丈七尺(約105メートル)、
基礎の周囲は三十九丈五尺(約120メートル)、
光背は一基で高さ十一丈四尺(約34.5メートル)、
幅九丈六尺(約29メートル)でしたが、この光背は今では失われてしまっています。

使用された材料は、
熟銅が七万三千九百六十斤(約44.4トン)、
白錫が一万一千六百三十八斤余(約7トン)、
金が一万四百三十六両(約390キログラム)、
銅が五万八千二十両(約2.2トン)、
炭が一万六千三百五十六石(約2,940立方メートル)でした。

脇侍の菩薩像二体はそれぞれ高さ三丈(約9メートル)、
壁画の観自在菩薩二面はそれぞれ高さ五丈(約15メートル)、幅三丈八寸四分(約9.1メートル)、
四天王像四体はそれぞれ高さ四丈(約12メートル)でした。
これらの寸法はすべて朝野群載に記されています。四天王像については、寺の炎上後、後鳥羽院の元久元年十一月二十日に供養が行われたと帝王編年記に記されています。これは大仏供養から八年後のことです。しかし、脇侍の二体の菩薩像も四天王像も永禄十年の火災で失われ、現在は礎石だけが残っています。

大仏殿そのものは、
高さ十五丈六尺(約47メートル)、
東西二十九丈(約88メートル)、
南北十七丈(約51.5メートル)、
基礎の高さは七尺(約2.1メートル)、
東西の階段は三十二丈七尺(約99メートル)、
南北の階段は二十丈六尺(約62.4メートル)、
およそ八十四枚の石材が使用され、
十六の門扉(天台様式で三千百二十二の装飾)があり、
回廊には二十の扉があって、
東西の長さは五十四丈(約164メートル)、
南北の長さは六十丈(約182メートル)でした。
大工棟梁は猪名部氏の従五位下益田絶手であったと伝えられています。

天平勝宝元年十二月七日、孝謙天皇、聖武天皇、光明皇后が行幸された際には、行列の様式を整え、五十人の僧侶が仏前での礼拝と読経の儀式を執り行いました。

西大門は雲井坂の東側にありました。後に「金光明四天王護国之寺」という額が掲げられ、これは弘法大師の筆によるものと伝えられています。その文字の中で「王」の字が特に大きく書かれているのは、天皇の徳が天に満ちていることを表現したものです。額の両側には梵天、帝釈天、四天王、金剛力士の像が配置され、これは国家守護の象徴とされていました。

この額は現存して、今は勧進所の蔵にあります。『太字高祖伝』によると、この寺は城大寺と呼ばれ、国分寺の門であったと『弘法伝通記』に記されています。この門がいつなくなったのかは分かりません。

南大門は吉城川の北にある門です。ここにも大師(弘法大師)の筆による「大華厳寺」という額があったそうです。しかし、昔、東南院の本勢(もとせい)一代の御門宣(勅命)で、「この寺は八宗(仏教八宗派)を兼学しているとはいえ、特に三論宗と華厳宗を重視している。どうして華厳宗だけに限定するのか」として、南門と西門の額を下ろすよう命じられたということです。伝え聞くところによると、応永2年(1395年)8月に自然と朽ち果てて倒れたのを再建したそうです。門の表には帝釈天の像、裏には石の獅子が今も残っています。中門と呼ばれる門は、ここより北に礎石だけが残っています。

さて、行基菩薩が大仏の供養の導師を務めるようにとの宣下が下されましたが、僧正は「このような重要な導師は、私のような凡僧の身分には相応しくありません。近いうちに南天竺から普賢菩薩がお越しになるはずですから、その朝まで待って、供養開眼の導師をお務めいただくのがよろしいでしょう」と辞退なさいました。

そこで行基菩薩は先導役として、百人の僧侶と治部・玄蕃・雅楽の三司を従え、摂津国の難波の浜辺から船出しました。香と花を供えながら進む様子は、法衣の袖が百花の風に翻るかのようで、伎楽の音色は万の波のさざめきと調和していました。

しばらくすると沖の方から波に乗って船が近づいてきました。互いに相手かと思ったのでしょう、櫓や櫂で船を制御して見ていると、その中に着岸しました。婆羅門僧正は、大勢の人々の中を分けて行基菩薩に近づき、微笑んで四度ほど会釈をして手を取って言われました。「迦毘羅衛城で共に誓い合った甲斐があって、文殊菩薩の御顔に再会できましたね」。

行基菩薩は「霊山での釈迦の御前での誓いが真如(真理)として明らかになり、今日お会いすることができましたね」と返しました。この歌の中で「釈迦の御前で誓った」というのは間違いないでしょう。文殊の二菩薩が理と智の一対となってこの大伽藍を建て、本師如来(釈迦)の像を造立し、末世の衆生を救済しようということは、釈尊在世の時、祇園精舎での説法の際にすでに約束されていたのでしょう。

婆羅門僧正は菩提僧正と呼ばれ、普賢菩薩の化身であり、行基は文殊、良弁は弥勒菩薩の化現、そして本願の聖武天皇は救世観音の化身として深い願いを込められ、この四聖が心を一つにして創建したのです。釈迦が霊鷲山で説法された時の観音、文殊、普賢、弥勒の菩薩たちが衆生救済の計らいをめぐらし、四聖が同時に現れ出たと見えます。

またその頃、東大寺東南院に聖宝僧正という非常に優れた僧がおられました。大峯の大蛇も、この僧正によって退治され、今も一般の人々が大峯に入るのは、ひとえに聖宝の影響によるものです。推古天皇の治世12年に、聖徳太子が夢のお告げを受けて楓野に行幸されました。泉川の北のほとりに宿られた時、左右に向かってこう言われました。「私が亡くなってから250年後に、ある僧がこの池に寺を建てるだろう。その僧は私の後身となるはずだ」。また同25年に、作深川の北に立って「私は来世で帝王となり、南の丘に精舎を建てて仏法を広め、三度『聖』の字を持つことになるだろう」と言われたそうです。これが即ち聖宝僧正のことなのです。

その聖徳太子の誕生の昔を思い返せば、お母様の夢に金色の僧が現れて、「私は世を救う者であり、しばらくの間あなたの胎内に宿らせていただきたい」と告げました。お母様が「このようにおっしゃるのはどなたですか」とお尋ねになると、その僧は「私は観音です。住まいはここより西にあります」と答えました。お母様は「私の身は穢れています。どうして宿ることができましょうか」とおっしゃいましたが、「私は穢れを厭いません」と言われたので、「ではお願いいたします」とお許しになると、母の口に飛び込まれたように感じ、すぐに身籠られたということです。本願である皇帝(聖武天皇)が救世観音の化身であることは疑う余地がありません。

かの菩提僧正は、鎗石の香炉五具、菩提樹の実で作った数珠十連、多羅葉(貝葉)の経典百枚、仏舎利三十粒、その他様々な宝物を天竺から持参されました。これらを行基僧正を通じて天皇に献上されると、天皇は深く感銘を受けられました。

そして天平勝宝4年(752年)壬辰の4日と9日に開眼供養が執り行われました。文官武官の百官が同じように供奉し、大小の雅楽の音楽や珍しい宝物などが奉納されました。数万人の僧を招き、音楽が東西に鳴り響く中、供養導師は例の普賢菩薩の化身である菩提僧正、講師は観音の化身である元興寺の隆尊、呪願師は大唐の道璃律師、読師は延福、梵音師二百人、維那六人、錫杖衆二百人、預師十人、散華師十人、定者二十人、納衆三百四十人、その他の僧侶や沙弥が八千八百九十四人、合計一万二十六人が参加しました。

菩提僧正は高座に登り、筆を取って開眼供養を行いました。その筆には緑色を付けられました。参詣の人々は次々と列をなして、皆開眼の縁を結ぼうとしました。この時、菩提僧正は白衣を着て、六本の牙を持つ白象に乗って大会の庭にお出でになり、人々は皆驚いて見つめました。これこそ普賢菩薩の化現に違いありません。

この供養の日、元興寺から奉られた歌には、
「一つの法(仏法)のもとに花が咲き誇りました。今日からは仏の教えが栄えていくことでしょう」

また聖武天皇は、
「麗しいわが思う君(大仏)はこれによって三門を通じて万代まで続くように」
と御順礼記に記されています。

総じてこの日は様々な吉兆がありましたが、その中でも特に、伽藍建立の始めに鱸(すずき)を売る老人が現れ、天皇はその者を召し寄せて大会の講師とお命じになりました。

勢いよく見せたところ、翁は鱸を短机の上に置いたが、それは変化して八十巻の華厳経となった。講説の間、サンスクリット語を響かせ、法会の最中に高座に上がったかと思うと、忽然と姿を消してしまった。

別の説では、鰤を売る翁が高座に杖をついて年齢を重ねた様子で、その朝の年齢は八十歳であった。それが変化して八十巻の華厳経となったという。その杖を大仏の内陣東の四廬の前に突き立てておいたところ、たちまち枝葉を生やして白い榛の木となった。それから長い年月が経っても枯れることなく立っていたが、平家の兵火によって焼失してしまったという。

東大寺では法会があり、これを華厳会という。大仏殿の内陣に高座を設け、講師が登って堂の後ろから逃げ出すように去っていくのが終わりとなる。あの姿を現した翁から始まってそれが永い例となったと、『続古事談』に記されている。

また供養の日には、生まれながらの者から成人に至るまで、諸々の法会の場で天王の御前に跪き、「南談阿梨耶波盧枳帝慳羅耶菩提真淫波耶」と唱え続けた。そのように消えゆき、また南大門の木像の獅子が吼えたという。御願の歌に感動したためだと『盛衰記』に見える。

まことに八宗兼学の窓に積もる雪、七堂伽藍の軒に生える苔、十六丈の金銅の尊像が厳かに現れ給う。天竺や震旦(中国)にも石や木で造られた大仏は多くあるというが、金銅の像は未だ聞かないと弘憲僧正の筆跡が思い出される。

皇后光明皇后は慈悲の深さのあまり、温室(浴室)を設け、毎月十八度、癩病患者たちを入浴させられました。皇后自らがその浴室に出向かれ、ご自身の手で癩病の人々を丁寧に浴させられたので、その大慈大悲の利益は広大無辺であり、阿弥陀如来が毎度影向(姿を現すこと)されたといいます。その温室は「所図寺(ところずじ)」と名付けられました。

さて、天皇は円大寺を建立され、内陣には女性を参詣させないことにされていましたので、皇后もこれに応じて西に法華寺を建立なさり、法華滅罪寺と名付け、ご自身の手で十一面観音の像を刻ませ、内陣には男性を入れないことにされました。そのため、大和国においては東大寺を僧侶の国分寺とし、法華寺を尼僧の国分寺としたのは当然のことでした。

ここから東大寺までの道のりは十八町(約2キロメートル)あります。光明皇后が順礼される度に、その道の左右に東大寺まで屏風を立てられたと伝えられています。その屏風は大仏供養の時に唐から三十領の鎧とともに渡来したもので、「鴨の毛の屏風」と呼ばれています。銘があり、現在は東大寺勅封の三倉に保管されています。このようなことから、今に至るまで法華寺は尼僧の経を読む寺として女性たちが住持しています。あの小松中将重盛の侍従である滝口時頼の妻、野礼門院の雅司「横笛」という女性も出家してこの寺に住んでいましたが、今でも横笛堂という建物が残っているそうで、『平家物語』にもその記述があったかと思います。

また、慈鎮和尚が東大寺の仏について詠まれた歌に、
「是非とは東大寺荒れてけれど、仏ありこがねの大仏かな」
というものがあります。

果(東)塔の跡は野田の辺りに礎石だけが残っており、昔の寸法によると高さ二十三丈八寸(約70メートル)、露盤の高さ八丈八尺二寸(約27メートル)でした。雨(西)塔は気比多明神の辺りに礎石だけが残っています。これも高さ二十三丈六尺七寸(約71メートル)で、露盤の高さは東塔と同じだったとされています。両塔の落盤の清具には熟銅七万五千五百二斤五両(約45トン)、白銅四百九斤十両(約246キログラム)、練金千五十両(約39キログラム)が使用されました。ある説では天平勝宝5年(753年)3月3日に造立されたとされています。東塔は一条院の御代、長保2年(1000年)10月19日に炎上し、西塔は朱雀院の御代に落雷で焼失しました。その後、後宇多院の建治元年(1275年)2月29日に西塔の日取りと時刻を定めて再興されましたが、その後いつなくなったのかは分かりません。

鐘楼は念仏堂の際にあり、鐘は今でも変わることなく耳に響いています。あの童が鋳造した「奈良次郎」と呼ばれる鐘です。高さ一丈三尺六寸(約4.1メートル)、口の径九尺一寸一分(約2.8メートル)、厚さ八寸(約24センチメートル)で、熟銅五万二千六百八十斤(約31.6トン)、白銅二千三百斤(約1.4トン)を用いています。日本一の鐘です。奈良八景の一つとして、前大納言善成が、
「なべて霜の花も美しい、名高く残る古い寺の鐘の郷音よ」
と詠んでいます。八景を詠んだ歌は人々によく知られています。

講堂は天平勝宝年間(749-757)の建立で、本尊は五千手観音です。万人の僧による供養の際には、天人が降り、花が降り注ぎ、不思議な香りが漂ったといいます。ここから十種の大楽(雅楽)が始められ演奏されたそうです。その後、延喜17年(917)11月にこの堂と三百の僧房が炎上し、朱雀院の天慶5年(942)に再建されたと『盛衰記』に記されています。また天平4年(932)に東大寺に落雷があったという記録があることから、この時の焼失後の再建について年代記に見えたのをそのまま書き留めました。さらに高倉院の治承4年(1180)に炎上し、嘉禎3年(1237)4月19日に様式を改めて再建されました。永禄10年(1567)に炎上して以来、再建されることなく、跡だけが大仏の後ろに残っています。

結果の評価と今後の課題

どうでしょうか。
作業させている間は気づきませんでしたが、分割作業単位で「です/ます」調と「だ/である」調が混ざっており、その指定もプロンプトで必要であったなど、反省点もあります。
また、翻刻レベルで一字一字翻刻漏れや明らかな誤認識が含まれていないか確認はしておらず、これをもって最終稿とできるレベルのものでは決してありません。

が、前半でも述べた通り、誤認識や翻刻漏れの検出にも、コンテキストの理解は重要です。
くずし字や候文に慣れていない作業者が、まず大まかにコンテキストをつかむには、十分な精度が出ているのではないでしょうか。
飽くまで最終稿に使えるようなものではないということは頭に入れつつ、活用していくことが大切でしょう。

また、その最終稿の扱い自体、飽くまで自分の調べたいことの早期確認、あるいはよくて責任のないオープンデータレベルの情報共有で済ませることが重要であって、たとえばこれをもって翻刻や口語訳の商業的発行をし、くずし字解釈や付随する解説などに対して、専門課程でくずし字解釈や資料知識などを身に着けた人からの商売機会を奪うようなことはすべきではないでしょう。
どこまでいっても生成AIは人間の知性の模倣あるいは補完手段でしかなく、専門的教育を受けた人間の判断に勝てることはありません。
その判断は専門的教育を受けていない人間にはわからないので、自己責任で出す論考の一部としてならばともかく、商業出版などでは、最終的には専門的教育を受けた人の助力を頼むべきだと、個人的には思います。
むしろ、専門的教育を受けた人であっても、知的単純労働である翻刻といったところは労力を省略したいと思っているのではないかと推測しますが、その部分を省力化しつつ、専門的教育の成果をフルで出せる解説などの部分に、専門的教育を受けた人が注力できる環境を提供するのが、今後の機械学習、生成AIと人間とのうまい付き合いではないかと感じています。

  1. くずし字判読OCRの結果に失望してから、筆者は生成AI自体にくずし字画像を読ませてみたが、まったく無理でした。

  2. 全体を対象としなかったのは、最新のLLMモデルの使用量上限にひっかかったためです。

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?