すでに令和2年となり、個人的な元号予想チャレンジから1年経ちました。
今更ながらの話ですが、「令和」があっけないほど簡単に見つかってしまう方法をメモしておきます。
元号を定める時の暗黙の制約とは?
当時、わたしは元号予想の上で重要なことに気が付いていました。
ここで、これまでの元号の典拠を振り返ってみましょう。
明治:「易経」の「聖人南面して天下を聴き、明に嚮ひて治む」が由来。
大正:「易経」の「大いに亨りて以て正しきは、天の道なり」が由来。
昭和:「書経尭典」の「百姓昭明にして萬邦を協和す」が由来。
平成:「史記」五帝本記の「内平外成」(内平らかに外成る)と「書経」大禹謨の「地平天成」が由来。
このように元号に使われる二つの漢字は、一文中のわずかに隔たったところに存在しています。○○○明○治○○○、○○○大○○正○○○、○○○昭○○○○和○○○、など。
上記のわずか4例から判断しているに過ぎませんが、元号を絞り込む制約の一つとして使えると考えていました。
鋭い方は、すでにお分かりかと思いますが、テキストマイニングの条件に加えたアイデアは、たったそれだけです。
それ以外の制約も振り返ってみましょう。
小学生でも簡単に書ける
現代の事情を鑑みると、元号は、小学生でも簡単に書けるように配慮したのか「教育漢字」が用いられています。1
しかも、4学年までの配当漢字となっています。大(1年)正(1年)明(2年)、昭昭(3年)和(3年)治(4年)成(4年)
書字の難易度からも画数が多くはないと考えられます。参考までに、総画数は、明治(16画)、大正(8画)、昭和(17画)、平成(11画)です。反対に画数が少な過ぎても元号として採用されることはないと考えられます。
英字で略す慣習
また、実用上、ローマ字にしたときの頭文字がMTSH以外という制約も知られていました。
明治(M)、大正(T)、昭和(S)、平成(H)
これらに加え、新元号に使われる漢字は、過去に元号に用いられた漢字、または、元号に使われなかったが候補となった元号に用いられた漢字である可能性があることも、条件としては十分に有効であるとされていました。
公式ルール
制度的には、国によって決められている基本ルールがあります。
- 『昭和大礼記録(第一冊)』
元号は本邦はもとより言うを俟たず、支那、朝鮮、南詔、交趾(ベトナム)等の年号、その帝王、后妃、人臣の諡号、名字等及び宮殿、土地の名称等と重複せざるものなるべきこと。
元号は、国家の一大理想を表徴するに足るものとなるべきこと。
元号は、古典に出拠を有し、その字面は雅馴にして、その意義は深長なるべきこと。
元号は、称呼上、音階調和を要すべきこと。
元号は、その字面簡単平易なるべきこと。
- 「元号法に定める元号の選定」(1979年)
国民の理想としてふさわしいようなよい意味を持つものであること。
漢字2字であること(3文字以上は不可。但し、749年から770年にかけては、漢字4文字の元号が使用されている)。
書きやすいこと。
読みやすいこと。
これまでに元号又はおくり名として用いられたものでないこと(過去の元号の再使用は不可)。
俗用されているものでないこと(人名・地名・商品名・企業名等は不可)
はたして典拠は?
それでは、新元号の典拠となるのは、どの書物になるのか?
回数が多いのは「五経(ごきょう)」と呼ばれる儒教書。紀元前の中国で成立しており、最古の歴史書「書経」が36回と最多。次いで「易経」27回。最古の詩集「詩経」も8番目の15回引用されたそうです。
これらの膨大な漢籍の中から探さなければならない。
そこでほとんどの人は挫折するものと考えられます。
しかし今回は、大きなヒントがありました。
「国書」からの採用の可能性が伝えられていたのです。2
年号候補絞り込みのプロセス
ここからは「後出しジャンケン」的な余談になりますが、興味のある方は、ぜひお付き合いください。
典拠が「万葉集」であるという仮定のもとで上記のルールを適用していたら、「令和」が、あっけないほど簡単に最終候補の中に現れました。以下は、元号を絞り込んでいく過程です。
- 年号マイニングのために必要なデータの収集
- 画数の制約を検討
- 原文のマイニング
- 使用される漢字の条件を適用
- 年号のイニシャルの制約を適用
- 年号候補一覧
データ集め
次のデータを集めます。これ以外は用いません。
- 万葉集3
- 漢字データ(教育漢字 学年 画数 音読み)
- 過去の元号一覧
- 過去の元号候補一覧
画数の制約を検討
過去の年号の総画数の分布から、年号は、7画以上18画未満という制約を設けます。
18画を超える場合、一例として、 '明教': 19画, '徳安':20画となり、手書きに時間がかかります。したがいまして、総画数18画未満と考えました。
過去に元号に使われている小学生の漢字を調査 → 10404個
過去の元号は、180字が繰り返し使われており、そのうち103字が小学生の漢字でした。
一見すると少ないように思いますが、それらすべての組み合わせを計算すると、
103*102=10404個です。
万葉集の「原文」(4565文)を取得し、条件にあった漢字の組み合わせを取得する → 1329個
年号に使われる漢字2字が、「原文」中に1字から10字だけ離れて記載されているという条件で検索してみます。その結果、条件を満たす組み合わせは、1329個でした。
重複と画数の制約を加える → 917個
そのうち、過去に使われたことのある年号を取り除き、総画数18画未満とすると、917個
音読みがMTSH以外の漢字に絞る → 411個
小学校4学年までの漢字に絞る → 247個
年号の一番目の漢字と二番目の漢字が過去の年号に使われているものだけを選ぶ → 128個
あらかじめ考えていた制約では、これ以上絞り込むことはできません。
見ると、**'令和'**があるではありませんか。pythonでソートすると、なんとたまたま先頭に出てきて驚きました。
以下、128個の一覧です。
['令和', '令始', '令平', '令明', '令正', '令見', '令道', '令長', '令鳥', '光清', '光見', '光長', '光雲', '和世', '和中', '和受', '和大', '和天', '和太', '和安', '和成', '和治', '和見', '和通', '和高', '字和', '安万', '安世', '安受', '安大', '安天', '安太', '安定', '安平', '安成', '安文', '安紀', '安老', '安見', '安通', '安道', '安雲', '安高', '安鳥', '有万', '有世', '有中', '有光', '有初', '有勝', '有受', '有命', '有和', '有大', '有天', '有太', '有始', '有安', '有平', '有成', '有文', '有明', '有清', '有老', '有見', '有通', '有道', '有長', '有雲', '有高', '有鳥', '漢太', '用通', '礼万', '礼世', '礼中', '礼光', '礼受', '礼和', '礼大', '礼天', '礼太', '礼安', '礼定', '礼平', '礼成', '礼文', '礼明', '礼見', '礼通', '礼長', '礼雲', '礼高', '礼鳥', '立世', '立中', '立初', '立勝', '立和', '立大', '立天', '立太', '立安', '立明', '立清', '立節', '立見', '立通', '立道', '立長', '立雲', '立高', '立鳥', '開世', '開中', '開天', '開太', '開文', '高世', '高天', '高安', '高成', '高文', '高明', '高治', '高老', '高見', '高長']
まとめ
「年号が典拠からどのように選ばれるか」という点に着目し、実用上の観点から制限を設けた結果、最終候補に「令和」があった。ただそれだけのことですが、面白かったので共有しました。次の課題としては、この128個の候補の中から、次の条件によって絞り込むことです。
- 古典に出拠を有し、その字面は雅馴にして、その意義は深長なるべきこと。
- 元号は、称呼上、音階調和を要すべきこと。
- 国民の理想としてふさわしいようなよい意味を持つものであること。
-
戦前の常用漢字 当用漢字 など https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/sisaku/enkaku/enkaku11.html ↩
-
政府発表の年号候補「英弘(えいこう)」は日本最古の歴史書・古事記が出典。「久化(きゅうか)」は中国の古典から。「広至(こうし)」は日本書紀と中国の古典「詩経」が出典。「万和(ばんな)」「万保(ばんぽう)」は中国の古典に由来する。 ↩
-
万葉集をスクレーピングまたはこちらからダウンロードします。 https://ds22.cc.yamaguchi-u.ac.jp/~y_makoto/man_corner.html ↩