概要
Pythonで漢字をひらがなに変換する方法を調べてみた。
実行環境
Python 3.8.8
macOS Catalina v10.15.4
インストール
pykakasiを使うと漢字をひらがなやローマ字にすることができる。
anacondaでインストールする場合
terminal
% conda search pykakasi
pip の時は
terminal
% pip install pykakasi
実際に変換する
>>> from pykakasi import kakasi
>>> # インスタンスの作成
>>> kks = kakasi()
>>> word = "僕は未来から来た猫型ロボット"
>>> result = kks.convert(word)
>>> result
[{'orig': '僕は', 'hira': 'ぼくは', 'kana': 'ボクハ', 'hepburn': 'bokuha', 'kunrei': 'bokuha', 'passport': 'bokuha'}, {'orig': '未来', 'hira': 'みらい', 'kana': 'ミライ', 'hepburn': 'mirai', 'kunrei': 'mirai', 'passport': 'mirai'}, {'orig': 'から', 'hira': 'から', 'kana': 'カラ', 'hepburn': 'kara', 'kunrei': 'kara', 'passport': 'kara'}, {'orig': '来た', 'hira': 'きた', 'kana': 'キタ', 'hepburn': 'kita', 'kunrei': 'kita', 'passport': 'kita'}, {'orig': '猫型', 'hira': 'ねこがた', 'kana': 'ネコガタ', 'hepburn': 'nekogata', 'kunrei': 'nekogata', 'passport': 'nekogata'}, {'orig': 'ロボット', 'hira': 'ろぼっと', 'kana': 'ロボット', 'hepburn': 'robotto', 'kunrei': 'robotto', 'passport': 'robotto'}]
>>> result[0]
{'orig': '僕は', 'hira': 'ぼくは', 'kana': 'ボクハ', 'hepburn': 'bokuha', 'kunrei': 'bokuha', 'passport': 'bokuha'}
>>> # ひらがなにする
>>> for converted_word in result:
... print(f"{converted_word['hira']}", end ="")
...
ぼくはみらいからきたねこがたろぼっと
>>> # カタカナにする
>>> for converted_word in result:
... print(f"{converted_word['kana']}", end ="")
...
ボクハミライカラキタネコガタロボット
>>> # ローマ字にする
>>> for converted_word in result:
... print(f"{converted_word['hepburn']}", end ="")
...
bokuhamiraikarakitanekogatarobotto