自動処理したデータは、とりあえず検証しようね的な話をちょっくら。これは趣味の範囲で、漢字の読みを探していたのだけれど、Unihanデータベースを元にしたと思われるユニコードの読み検索サイトがちょぼちょぼ見つかった。でも、なんかちょぼちょぼ変なコトバが目に入ったので、「読み」だけ抽出して試しに校正ソフトウェア(Just Right!)にかけてみてわっはっは。
「あにょめ」って、「あによめ」だよね? 「あかあるむ」って「あかるむ」だよね? 旧仮名遣いについては、漢文訓読とか旧仮名遣いでしか用例がないからそうしているのかも知れないから迂闊に笑えないけれど、それにしてもなんだかな、という感じ。Unihanがおかしいのか、それを加工した人がやっちゃったのかは確かめていないけれど、ともかくわっはっは。1267件の指摘という、微妙に手作業で直す見通しが立つくらいの量なのがまた……。