More than 5 years have passed since last update.

文字と濁点・半濁点が分かれていて，それらを結合したい時

Posted at 2012-02-08

例えば「レポート」という文字列をユニコードで扱うときに，
文字「ポ」が「ホ + ゜」というように，文字と濁点・半濁点に分かれてしまう場合

join_dakuten.py

import unicodedata
unicodedata.normalize('NKFC', unistr)

この関数をかませれば
「ホ + ゜」を「ポ」として扱うことができる