動機
Docomoにもいろいろ自然言語処理のAPIがあることを知りました。
せっかくなので形態素解析をしてみましょう
ソース
import re
import sys
import json
import requests
target_url = "https://api.apigw.smt.docomo.ne.jp/gooLanguageAnalysis/v1/morph?APIKEY="
api_key = "api_key"
def parse(sentence):
headers = {
"Content-Type": "application/json",
}
data = {
"sentence": sentence,
}
r = requests.post(target_url+api_key,
headers=headers,
data=json.dumps(data))
return r.json()
sentence = "私はその人の記憶を呼び起すごとに、すぐ「先生」といいたくなる"
response = parse(sentence)
for line in response["word_list"][0]:
print("{} = {}".format(line[0], line[1]))
出力結果
私 = 名詞
は = 連用助詞
その = 連体詞
人 = 名詞
の = 格助詞
記憶 = 名詞
を = 格助詞
呼び起 = 動詞語幹
す = 動詞接尾辞
ごと = 補助名詞
に = 格助詞
、 = 読点
すぐ = 連用詞
「 = 括弧
先生 = 名詞
」 = 括弧
と = 格助詞
い = 動詞語幹
い = 動詞活用語尾
た = 動詞接尾辞
く = 形容詞接尾辞
な = 動詞語幹
る = 動詞接尾辞
まとめ
少し返ってくる形が違いますが、NTT研究所の成果を使ってるなら、
COTOHA APIと返ってくる結果も同じでしょうか。
後日調べてみたいと思います。
jsonで返ってくることと、認証がいらないことはいいと思います。