さすがはJava製のkuromojiはOSに依存することもなくMavenにも対応しているので、とても導入しやすくて使いやすいです。
本投稿のタイトルにはWin10とEclipseと入れておりますが、kuromojiはどちらにも依存していません。
Maven
セットアップはたったこれだけ。
モデルデータもダウンロードされます。
<!-- https://mvnrepository.com/artifact/com.atilika.kuromoji/kuromoji -->
<dependency>
<groupId>com.atilika.kuromoji</groupId>
<artifactId>kuromoji</artifactId>
<version>0.9.0</version>
<type>pom</type>
</dependency>
<dependency>
<groupId>com.atilika.kuromoji</groupId>
<artifactId>kuromoji-ipadic</artifactId>
<version>0.9.0</version>
</dependency>
Code
サンプルコードそのままです。
// https://www.atilika.com/ja/kuromoji/
package hello.kuromoji;
import com.atilika.kuromoji.ipadic.Token;
import com.atilika.kuromoji.ipadic.Tokenizer;
import java.util.List;
public class KuromojiExample {
public static void main(String[] args) {
Tokenizer tokenizer = new Tokenizer();
List<Token> tokens = tokenizer.tokenize("お寿司が食べたい。カレーも食べたい。");
for (Token token : tokens) {
System.out.println(token.getSurface() + "\t" + token.getAllFeatures());
}
}
}
実行結果
お 接頭詞,名詞接続,*,*,*,*,お,オ,オ
寿司 名詞,一般,*,*,*,*,寿司,スシ,スシ
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ
。 記号,句点,*,*,*,*,。,。,。
カレー 名詞,一般,*,*,*,*,カレー,カレー,カレー
も 助詞,係助詞,*,*,*,*,も,モ,モ
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
たい 助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ
。 記号,句点,*,*,*,*,。,。,。
所感
Kuromoji はとても使いやすいです。
参照
参考にしたページ
kuromoji | Atilika
https://www.atilika.com/ja/kuromoji/