LoginSignup
6
4

More than 3 years have passed since last update.

docomoの形態素解析apiを使ってみる

Last updated at Posted at 2019-06-09

動機

Docomoにもいろいろ自然言語処理のAPIがあることを知りました。
せっかくなので形態素解析をしてみましょう

ソース

import re
import sys
import json
import requests

target_url = "https://api.apigw.smt.docomo.ne.jp/gooLanguageAnalysis/v1/morph?APIKEY="
api_key = "api_key"

def parse(sentence):
    headers = {
        "Content-Type": "application/json",
    }
    data = {
        "sentence": sentence,
    }
    r = requests.post(target_url+api_key,
                      headers=headers,
                      data=json.dumps(data))
    return r.json()

sentence = "私はその人の記憶を呼び起すごとに、すぐ「先生」といいたくなる"
response = parse(sentence)

for line in response["word_list"][0]:
    print("{} = {}".format(line[0], line[1]))

出力結果

私 = 名詞
は = 連用助詞
その = 連体詞
人 = 名詞
の = 格助詞
記憶 = 名詞
を = 格助詞
呼び起 = 動詞語幹
す = 動詞接尾辞
ごと = 補助名詞
に = 格助詞
、 = 読点
すぐ = 連用詞
「 = 括弧
先生 = 名詞
」 = 括弧
と = 格助詞
い = 動詞語幹
い = 動詞活用語尾
た = 動詞接尾辞
く = 形容詞接尾辞
な = 動詞語幹
る = 動詞接尾辞

まとめ

少し返ってくる形が違いますが、NTT研究所の成果を使ってるなら、
COTOHA APIと返ってくる結果も同じでしょうか。
後日調べてみたいと思います。
jsonで返ってくることと、認証がいらないことはいいと思います。

6
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
4