LoginSignup
0
0

More than 1 year has passed since last update.

Python3: cos類似度を計算 (ginza)

Posted at

こちらと同じことを ginza で行いました。
Python3: cos類似度を計算 (janome)
Python3: cos類似度を計算 (Mecab)

次のページを参考にしました。
何もない所から一瞬で、自然言語処理と係り受け解析をライブコーディングする手品を、LTでやってみた話

ライブラリーのインストール

pip3 install tqdm
ginza_check.py
#! /usr/bin/python
#
#   ginza_check.py
#                   Nov/27/2021
# ------------------------------------------------------------------
import sys
import spacy
nlp = spacy.load('ja_ginza')

# ------------------------------------------------------------------
sys.stderr.write("*** 開始 ***\n")

sentence_list = [
        '昔ある所に、王様がいました。',  # 文章A
        'ある所に、かわいい女の子がいました。',  # 文章B
        '一人の王様がいました。',  # 文章C
        '昔ある所に、貧しい女がいました。',  # 文章D
        '昔、王様がある所にいました。',  # 文章E
        ] 

doc0 = nlp(sentence_list[0])
doc1 = nlp(sentence_list[1])
doc2 = nlp(sentence_list[2])
doc3 = nlp(sentence_list[3])
doc4 = nlp(sentence_list[4])

print(doc0.similarity(doc1))
print(doc0.similarity(doc2))
print(doc0.similarity(doc3))
print(doc0.similarity(doc4))

sys.stderr.write("*** 終了 ***\n")
# ------------------------------------------------------------------

実行結果

$ ./ginza_check.py 
*** 開始 ***
0.9474321582971902
0.9597373335339604
0.9445045437998065
1.0000000473810928
*** 終了 ***
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0