Python
mecab

mecabの出力をpythonで整形

pythonでMeCabの出力を整形

自分用にmecabの出力をいい感じの文字列に整形する関数を作りました。あくまで自分用なので読みやすさは考慮してません。ですので間違いや、このほうがいいよ!など意見がある方はコメントお願いします。(pythonはそれほど詳しくないです。)
とはいえ一応関数の引数に例外を入れてしまったときの対処はif文で入れておきます。

sample.py
#第一引数のtextに形態素解析したい文字列を入力
#第二引数に0~3の<int>型を入力(出力の種類を決める)
#0は文字列、1はカタカナ、2は0に似てる?、3は形態素の属性値
def make_str_from_mecab(text='文字列を入力してください', e_type=0):
    if type(text) != str:
        text ='文字列を入力してください'
    if e_type > 3:
        e_type = 0
    mecab_obj = MeCab.Tagger("-Ochasen")
    mecab_list = mecab_obj.parse(text)
    #改行(\n)で分割
    d_new_line = mecab_list.split('\n')
    return_list = []
    for line in d_new_line[:-2]:
        morpheme_list = line.split('\t')
        morpheme = morpheme_list[e_type]
        return_list.append(morpheme)
        return_str = ' '.join(return_list)
    return return_str