文字学習をするにはMeCabがよいとの噂があったので利用してみた
【手順】
1.下記のMeCab本体のインストール
https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7WElGUGt6ejlpVXc
2.パスを通す
set PATH=%PATH%;C:\Program Files (x86)\MeCab\bin
3.pipでインストール
py -m pip install mecab-python-windows
後はコードで検証!
#coding: UTF-8
import MeCab
# オプション
# 1. -Ochasen
# 2. -Owakati
# 3. -Oyomi
# 4.mecabrc
text = '男だろ、負けてもいいから戦うくらいの勇気をもて'
tagger = MeCab.Tagger("-Ochasen")
str_output = tagger.parse(text)
print(str_output)
実行結果
男 オトコ 男 名詞-一般
だろ ダロ だ 助動詞 特殊・ダ 未然形
、 、 、 記号-読点
負け マケ 負ける 動詞-自立 一段 連用形
て テ て 助詞-接続助詞
も モ も 助詞-係助詞
いい イイ いい 形容詞-非自立 形容詞・イイ 基本形
から カラ から 助詞-接続助詞
戦う タタカウ 戦う 動詞-自立 五段・ワ行促音便 基本形
くらい クライ くらい 助詞-副助詞
の ノ の 助詞-連体化
勇気 ユウキ 勇気 名詞-一般
を ヲ を 助詞-格助詞-一般
もて モテ もてる 動詞-自立 一段 連用形
EOS
ドラえもんの名言から使っています
githubはこちら
次は言葉の判定処理の予定。。。