形態素解析エンジンmecabをvb.net に移植した VbMeCab 0.03を公開します。
公開場所は GitHub(https://github.com/k-ayaki/VbMeCab/)と
OSDN(https://github.com/k-ayaki/VbMeCab/)、
単純な移植なので、ライセンス条件はmecabおよびNMeCabと同様です。
いちばんの元となっているのが、C#で記載されたNMeCabです。ソースコードの構成が粗同一なところからもお分かりとおもいます。NMeCab版とのちがいは、ポインタ操作をすべて配列操作に書き換えたところです。つまり、少しだけNMeCabよりも遅く、代わりにNMeCabよりも少しだけ可読性がよい。
つまり、このソースプロジェクトの意味は、MeCabを更に他の言語に移植するための土台であります。
自分自身がMecabのソースコードを読む際の副産物です。
7月3日追記:VbMecabのPerformanceTest.exe の実行結果のキャプチャをとりました。
もっとも一般的なMecabの出力は、Parse(Lattice)とおもいますが、約1.2秒掛かっています。
NMecabとのパフォーマンスの差異を示すために、NMecabの実行結果のキャプチャをとりました。
Parse(Lattice)の出力に、約0.9秒掛かっています。これがポインタ操作と配列操作の速度差です。