Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
Help us understand the problem. What is going on with this article?

Javascriptで自然言語文字列が何語か調べるライブラリ

More than 5 years have passed since last update.

某案件でチャットに流れてくる文字列が何語か調べる必要があったので探してみた。

franc

最初に見つかったのがこれ
javascript language detectとかでググったら最初に出てきたやつ  
長文を調べるときには良さそうだけど今回使うのはチャットの短文
今日はいい天気程度の短文だとうまく検出できなかった
ついでにここに辞書データがあるんだけど
量が莫大でなんか高級感漂ってたので今回はボツ

guessLanguage.js

次に見つけたやつ
こっちだととかだけでもちゃんと日本語として検出してくれて便利
ソース読んでみるとUnicodeを文字種別に分けてこの文字はこの言語だみたいなことやってるみたい
容量も少ないしさくっとやりたいならこっちのほうがよさ気
ただしとかだと中国語として検出されてしまった

node-language-detect

使ってないけど一応見つけたので貼っておく

aoisensi
いいと思う
http://aoisensi.info
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away