LoginSignup
6
1

More than 5 years have passed since last update.

アイヌ語(小文字カタカナ、半角カタカナ)を日本語(全角カタカナ)に変換するスクリプトを書いた

Last updated at Posted at 2016-12-15

アイヌ語

概要

  • 以下の記事にあるようにアイヌ語にはカタカナの小文字が存在します(例: 「ㇰ,ㇱ,ㇲ,ㇳ,ㇴ」)
  • Unicodeとして存在していますが、ㇰはU+31F0、ㇱはU+31F1であることからアスキーコードの全角のクとㇰの差を応用することは厳しいです
  • また、Macのことえりでは標準で入力出来るらしいですが、Windowsなどでは標準で小文字カタカナを入力出来ないのでクなど半角カタカナで代用する場合もあります。
  • そこで、一部の半角カタカナも全角カタカナにするスクリプトにしました
  • https://ja.wiktionary.org/wiki/Wiktionary:アイヌ語のカナ表記

解決法

  • http://pumpkin.hatenablog.jp/entry/20090416/1239892152 のサイトを参考に人間味のあるコードを書きました
  • 2016年12月15日 scivolaさんのコメントを基に修正致しました ありがとうございます
    • trを用いるとセ゚など半濁点がつくものは2文字扱いになってずれてしまうようです
    • ピなどは別ですが...
def ainu_to_japanese(text)
    text.gsub(/プ|ㇷ゚/,"プ").gsub(/セ゚/, "セ").gsub(/ツ゚/, "ツ").gsub(/ト゚/, "ト").tr"ㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿクシストヌハヒフヘホムラリルレロ",
                              "クシストヌハヒフヘホムラリルレロクシストヌハヒフヘホムラリルレロ"
end

実行例

p ainu_to_japanese("アシケペッ")  # => "アシケペッ"
p ainu_to_japanese("チュㇷ゚ケㇱ") # => "チュプケシ"

問題

  • ㇴはヌとンの2つの読み方があるのですが、このコードでは使い分け出来ません
6
1
3

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
1