こちらと同じことを ginza で行いました。
Python3: cos類似度を計算 (janome)
Python3: cos類似度を計算 (Mecab)
次のページを参考にしました。
何もない所から一瞬で、自然言語処理と係り受け解析をライブコーディングする手品を、LTでやってみた話
ライブラリーのインストール
pip3 install tqdm
ginza_check.py
#! /usr/bin/python
#
# ginza_check.py
# Nov/27/2021
# ------------------------------------------------------------------
import sys
import spacy
nlp = spacy.load('ja_ginza')
# ------------------------------------------------------------------
sys.stderr.write("*** 開始 ***\n")
sentence_list = [
'昔ある所に、王様がいました。', # 文章A
'ある所に、かわいい女の子がいました。', # 文章B
'一人の王様がいました。', # 文章C
'昔ある所に、貧しい女がいました。', # 文章D
'昔、王様がある所にいました。', # 文章E
]
doc0 = nlp(sentence_list[0])
doc1 = nlp(sentence_list[1])
doc2 = nlp(sentence_list[2])
doc3 = nlp(sentence_list[3])
doc4 = nlp(sentence_list[4])
print(doc0.similarity(doc1))
print(doc0.similarity(doc2))
print(doc0.similarity(doc3))
print(doc0.similarity(doc4))
sys.stderr.write("*** 終了 ***\n")
# ------------------------------------------------------------------
実行結果
$ ./ginza_check.py
*** 開始 ***
0.9474321582971902
0.9597373335339604
0.9445045437998065
1.0000000473810928
*** 終了 ***