Posted at

文字と濁点・半濁点が分かれていて,それらを結合したい時

More than 5 years have passed since last update.

例えば「レポート」という文字列をユニコードで扱うときに,

文字「ポ」が「ホ + ゜」 というように,文字と濁点・半濁点に分かれてしまう場合


join_dakuten.py

import unicodedata

unicodedata.normalize('NKFC', unistr)

この関数をかませれば

「ホ + ゜」を「ポ」として扱うことができる