LoginSignup
0
0

More than 5 years have passed since last update.

保存したMeCabの解析結果からワンライナーで分かち書きを取得

Posted at

用途

  • 解析結果を以下のようにMeCab出力の形式で保存しており、そこからMeCab -Owakatiと同形式の分かち書きを取得したい場合
MeCab   MeCab   MeCab   MeCab   名詞-普通名詞-一般
の      ノ      ノ      の      助詞-格助詞
形式    ケーシキ        ケイシキ        形式    名詞-普通名詞-一般
で      デ      デ      で      助詞-格助詞
保存    ホゾン  ホゾン  保存    名詞-普通名詞-サ変可能
し      シ      スル    為る    動詞-非自立可能 サ行変格        連用形-一般
て      テ      テ      て      助詞-接続助詞
い      イ      イル    居る    動詞-非自立可能 上一段-ア行     連用形-一般
ます    マス    マス    ます    助動詞  助動詞-マス     終止形-一般
。                      。      補助記号-句点
EOS
  • 辞書を自分でメンテナンスしており、メンテナンスの段階ごとに解析結果を保存している場合
  • 分かち書きと詳細な解析結果を一緒に保存したくない

ワンライナー

任意の解析結果を分かち書きに修正する。

cat 解析結果.txt | cut -f1 | tr "\n" " " | sed -e "s/ EOS /\n/g" | sed -e "s/^ //g" | sed -e "s/$/ /1"

* MeCabの分かち書きは末尾にスペースを出力するため、それに形式を合わせている
よって末尾スペースを削除する場合は,最後のsedを削除すれば良い

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0