1冊の本の巻末索引を考えてみよう.それぞれのエントリーはどんな順序で並んでいるだろうか?
並べること,整列や配列,排列と呼ばれる話題である.JIS(日本工業規格)には,JIS X 4061 に,「日本語文字列照合順番」という規定がある(日本工業標準調査会 のページから「JIS 検索」を通じて閲覧できる).「照合順番」「照合する」などの用語については,JIS X 4061 に規定されているのでそちらを参照してほしいが,比較関数を作るとか,規則によって順番を付けるとかいった意味で捉えればよいはずである.(順番が付いた後にその順番に従って並べ替える操作は別操作だというだけのこと.)
この記事から始まる一連の投稿では,JIS X 4061 から,
-
- (2) 読み・表記照合
- 3.3 (1)/4.1 基本照合規則
を採用し,(日本語を解しない)実装者に要件を説明することを念頭に置いて,記述を整理することを狙う(最終的には英語またはオランダ語に翻訳することになる).なお,入出力の文字コードは UTF-8 を想定し,UTF-8 で日本語を扱う上での特有の注意事項はできるだけ漏らさず付け加えていきたいと考えている.