某案件でチャットに流れてくる文字列が何語か調べる必要があったので探してみた。
franc
最初に見つかったのがこれ
javascript language detectとかでググったら最初に出てきたやつ
長文を調べるときには良さそうだけど今回使うのはチャットの短文
今日はいい天気程度の短文だとうまく検出できなかった
ついでにここに辞書データがあるんだけど
量が莫大でなんか高級感漂ってたので今回はボツ
guessLanguage.js
次に見つけたやつ
こっちだとあとかだけでもちゃんと日本語として検出してくれて便利
ソース読んでみるとUnicodeを文字種別に分けてこの文字はこの言語だみたいなことやってるみたい
容量も少ないしさくっとやりたいならこっちのほうがよさ気
ただし漢とかだと中国語として検出されてしまった
node-language-detect
使ってないけど一応見つけたので貼っておく