#encoding: UTF-8
require 'java'
java_import org.atilika.kuromoji.Token
java_import org.atilika.kuromoji.Tokenizer
tokenizer = Tokenizer.builder().build();
tokens = tokenizer.tokenize(ARGV[0]).iterator
while tokens.hasNext
token = tokens.next
puts token.getSurfaceForm() + "\t" + token.getAllFeatures()
end
$ jruby -J-cp kuromoji-0.7.7/lib/kuromoji-0.7.7.jar test_tokenize.rb "ガンダムユニコーン"
ガンダムユニコーン 名詞,固有名詞,組織,*,*,*,*