Help us understand the problem. What is going on with this article?

アイヌ語(小文字カタカナ、半角カタカナ)を日本語(全角カタカナ)に変換するスクリプトを書いた

More than 3 years have passed since last update.

アイヌ語

概要

  • 以下の記事にあるようにアイヌ語にはカタカナの小文字が存在します(例: 「ㇰ,ㇱ,ㇲ,ㇳ,ㇴ」)
  • Unicodeとして存在していますが、ㇰはU+31F0、ㇱはU+31F1であることからアスキーコードの全角のクとㇰの差を応用することは厳しいです
  • また、Macのことえりでは標準で入力出来るらしいですが、Windowsなどでは標準で小文字カタカナを入力出来ないのでクなど半角カタカナで代用する場合もあります。
  • そこで、一部の半角カタカナも全角カタカナにするスクリプトにしました
  • https://ja.wiktionary.org/wiki/Wiktionary:アイヌ語のカナ表記

解決法

  • http://pumpkin.hatenablog.jp/entry/20090416/1239892152 のサイトを参考に人間味のあるコードを書きました
  • 2016年12月15日 scivolaさんのコメントを基に修正致しました ありがとうございます
    • trを用いるとセ゚など半濁点がつくものは2文字扱いになってずれてしまうようです
    • ピなどは別ですが...
def ainu_to_japanese(text)
    text.gsub(/プ|ㇷ゚/,"プ").gsub(/セ゚/, "セ").gsub(/ツ゚/, "ツ").gsub(/ト゚/, "ト").tr"ㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿクシストヌハヒフヘホムラリルレロ",
                              "クシストヌハヒフヘホムラリルレロクシストヌハヒフヘホムラリルレロ"
end

実行例

p ainu_to_japanese("アシケペッ")  # => "アシケペッ"
p ainu_to_japanese("チュㇷ゚ケㇱ") # => "チュプケシ"

問題

  • ㇴはヌとンの2つの読み方があるのですが、このコードでは使い分け出来ません
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした