100文字の文字列をnattoを使用して形態素解析してみました。
形態素解析エンジンにはmecabを使用。
文章を解析して配列に入れるとこまでを1万回繰り返しました。
VM上でやっています。数値は参考程度に。
equire 'benchmark'
require 'natto'
text = "人は歩みをとめたときに、そして挑戦をあきらめた時に年老いていくのだと思います。この道を行けばどうなるものか、危ぶむなかれ。危ぶめば道はなし。踏み出せばその一足が道となる。迷わず行けよ。行けばわかるさ。"
Benchmark.bm(7) do |x|
x.report("natto") {
10000.times do
arr=Array.new
nm = Natto::MeCab.new
nm.parse(text) do |n|
arr<<n.surface
end
end
}
end
- 結果
user | system | total | real | |
---|---|---|---|---|
natto | 10.780000 | 3.940000 | 14.720000 | 14.749078 |
ちなみに
arrの値は
["人", "は", "歩み", "を", "とめ", "た", "とき", "に", "、", "そして", "挑戦", "を", "あきらめ", "た", "時", "に", "年老い", "て", "いく", "の", "だ", "と", "思い", "ます", "。", "この", "道", "を", "行け", "ば", "どう", "なる", "もの", "か", "、", "危ぶむ", "なかれ", "。", "危ぶめ", "ば", "道", "は", "なし", "。", "踏み出せ", "ば", "その", "一足", "が", "道", "と", "なる", "。", "迷わ", "ず", "行け", "よ", "。", "行け", "ば", "わかる", "さ", "。", nil]
- 使用PC
MacBook Air
CPU: Intel Corei7 1.8GHz
Memory: 4GB
の上にVMをたてて500MBを割当て。