LoginSignup
2
2

More than 5 years have passed since last update.

Unihanを元にしたと思われるユニコードの読み検索が大変なことになっていた

Last updated at Posted at 2016-06-02

自動処理したデータは、とりあえず検証しようね的な話をちょっくら。これは趣味の範囲で、漢字の読みを探していたのだけれど、Unihanデータベースを元にしたと思われるユニコードの読み検索サイトがちょぼちょぼ見つかった。でも、なんかちょぼちょぼ変なコトバが目に入ったので、「読み」だけ抽出して試しに校正ソフトウェア(Just Right!)にかけてみてわっはっは。

「あにょめ」って、「あによめ」だよね? 「あかあるむ」って「あかるむ」だよね? 旧仮名遣いについては、漢文訓読とか旧仮名遣いでしか用例がないからそうしているのかも知れないから迂闊に笑えないけれど、それにしてもなんだかな、という感じ。Unihanがおかしいのか、それを加工した人がやっちゃったのかは確かめていないけれど、ともかくわっはっは。1267件の指摘という、微妙に手作業で直す見通しが立つくらいの量なのがまた……。

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2