用途
- 解析結果を以下のようにMeCab出力の形式で保存しており、そこからMeCab -Owakatiと同形式の分かち書きを取得したい場合
MeCab MeCab MeCab MeCab 名詞-普通名詞-一般
の ノ ノ の 助詞-格助詞
形式 ケーシキ ケイシキ 形式 名詞-普通名詞-一般
で デ デ で 助詞-格助詞
保存 ホゾン ホゾン 保存 名詞-普通名詞-サ変可能
し シ スル 為る 動詞-非自立可能 サ行変格 連用形-一般
て テ テ て 助詞-接続助詞
い イ イル 居る 動詞-非自立可能 上一段-ア行 連用形-一般
ます マス マス ます 助動詞 助動詞-マス 終止形-一般
。 。 補助記号-句点
EOS
- 辞書を自分でメンテナンスしており、メンテナンスの段階ごとに解析結果を保存している場合
- 分かち書きと詳細な解析結果を一緒に保存したくない
ワンライナー
任意の解析結果を分かち書きに修正する。
cat 解析結果.txt | cut -f1 | tr "\n" " " | sed -e "s/ EOS /\n/g" | sed -e "s/^ //g" | sed -e "s/$/ /1"
* MeCabの分かち書きは末尾にスペースを出力するため、それに形式を合わせている
よって末尾スペースを削除する場合は,最後のsedを削除すれば良い