Unicodeの正規化によって仮名の濁点がどうなるか、Ruby 2.3.1でやってみた。
スクリプト
input_str.unicode_normalize(:nfkc)
結果
入力 | コード | NFKC | コード | 説明 |
---|---|---|---|---|
が |
\u304c |
が |
\u304c |
が |
が |
\u304b\u3099 |
が |
\u304c |
か+合成濁点 |
か゛ |
\u304b\u309b |
か ゙ |
\u304b\u0020\u3099 |
か+単独濁点 |
ゔ |
\u3094 |
ゔ |
\u3094 |
濁点付きの"う" |
ゔ |
\u3046\u3099 |
ゔ |
\u3094 |
う+合成濁点 |
う゛ |
\u3046\u309b |
う ゙ |
\u3046\u0020\u3099 |
う+単独濁点 |
ヴ |
\u30f4 |
ヴ |
\u30f4 |
濁点付きの"ウ" |
ヴ |
\u30a6\u3099 |
ヴ |
\u30f4 |
ウ+合成濁点 |
ウ゛ |
\u30a6\u309b |
ウ ゙ |
\u30a6\u0020\u3099 |
ウ+合成濁点 |
ー |
\u30fc |
ー |
\u30fc |
長音記号 |
・ |
\u30fb |
・ |
\u30fb |
中黒 |
ゝゞ |
\u309d\u309e |
ゝゞ |
\u309d\u309e |
平仮名繰返し |
ヽヾ |
\u30fd\u30fe |
ヽヾ |
\u30fd\u30fe |
片仮名繰返し |
! |
\uff01 |
! |
\u0021 |
全角"!" |
( |
\uff08 |
( |
\u0028 |
全角"(" |
0 |
\uff10 |
0 |
\u0030 |
全角"0" |
@ |
\uff20 |
@ |
\u0040 |
全角"@" |
A |
\uff21 |
A |
\u0041 |
全角"A" |
\ |
\uff3c |
\ |
\u005c |
全角"\" |
~ |
\uff5e |
~ |
\u007e |
全角"~" |
・ |
\uff65 |
・ |
\u30fb |
半角中黒 |
ー |
\uff70 |
ー |
\u30fc |
半角長音記号 |
カ |
\uff76 |
カ |
\u30ab |
半角"カ" |
ガ |
\uff76\uff9e |
ガ |
\u30ac |
半角"カ"+半角濁点 |