アイヌ語
- アイヌ語については本記事の趣旨と異なるので下記を参照してください
- https://ja.wikipedia.org/wiki/アイヌ語
概要
- 以下の記事にあるようにアイヌ語にはカタカナの小文字が存在します(例: 「ㇰ,ㇱ,ㇲ,ㇳ,ㇴ」)
- Unicodeとして存在していますが、ㇰはU+31F0、ㇱはU+31F1であることからアスキーコードの全角のクとㇰの差を応用することは厳しいです
- また、Macのことえりでは標準で入力出来るらしいですが、Windowsなどでは標準で小文字カタカナを入力出来ないのでクなど半角カタカナで代用する場合もあります。
- そこで、一部の半角カタカナも全角カタカナにするスクリプトにしました
- https://ja.wiktionary.org/wiki/Wiktionary:アイヌ語のカナ表記
解決法
- http://pumpkin.hatenablog.jp/entry/20090416/1239892152 のサイトを参考に人間味のあるコードを書きました
- 2016年12月15日 scivolaさんのコメントを基に修正致しました ありがとうございます
- trを用いるとセ゚など半濁点がつくものは2文字扱いになってずれてしまうようです
- ピなどは別ですが...
def ainu_to_japanese(text)
text.gsub(/プ|ㇷ゚/,"プ").gsub(/セ゚/, "セ").gsub(/ツ゚/, "ツ").gsub(/ト゚/, "ト").tr"ㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿクシストヌハヒフヘホムラリルレロ",
"クシストヌハヒフヘホムラリルレロクシストヌハヒフヘホムラリルレロ"
end
実行例
p ainu_to_japanese("アシケペッ") # => "アシケペッ"
p ainu_to_japanese("チュㇷ゚ケㇱ") # => "チュプケシ"
問題
- ㇴはヌとンの2つの読み方があるのですが、このコードでは使い分け出来ません