LoginSignup
2
1

More than 1 year has passed since last update.

Everything (It's you)をComprehendしてみた

Last updated at Posted at 2022-02-14

Mr.Childrenの言わずと知れた名曲をComprehendに投入してみました。
ミスチル好きなものでして。

Amazon Comprehendとは

テキストを分析し、感情の判定やキーフレーズ検出などを行うことができる、機械学習を利用した自然言語処理(NLP)サービスです。コンソールから1分もかからずに分析できてしまいます。

解析されるインサイトは以下の6つ。

  • エンティティ
  • キーフレーズ
  • PII
  • 言語
  • 感情
  • 構文

リアルタイム解析を実行

image.png

スクリーンショット 2022-02-14 14.33.47.png

Input text に解析したい文章を入力しAnalyze
これだけです。たったこれだけで解析されちゃいます。Everything (It's you)の歌詞を入力し解析実行!

スクリーンショット 2022-02-14 14.37.21.png

解析結果

6つのインサイト

image.png

Entities

人、場所、位置などの情報に自動的に分類される情報。
STAY は人名と認識されたようです。

image.png

API Response.json
{
    "Entities": [
        {
            "Score": 0.6422388553619385,
            "Type": "DATE",
            "Text": "少年時代",
            "BeginOffset": 8,
            "EndOffset": 12
        },
        {
            "Score": 0.7727364897727966,
            "Type": "DATE",
            "Text": "今",
            "BeginOffset": 100,
            "EndOffset": 101
        },
        {
            "Score": 0.5865667462348938,
            "Type": "QUANTITY",
            "Text": "両手",
            "BeginOffset": 233,
            "EndOffset": 235
        },
        {
            "Score": 0.5952135920524597,
            "Type": "PERSON",
            "Text": "STAY",
            "BeginOffset": 322,
            "EndOffset": 326
        },
        {
            "Score": 0.5447555780410767,
            "Type": "QUANTITY",
            "Text": "一つ",
            "BeginOffset": 395,
            "EndOffset": 397
        }
    ]
}

Key phrases

「キーフレーズ」と分析されたフレーズとその信頼スコア
「世間」「少年時代」「自分」などが上位のようです。

image.png

API Response.json
{
    "KeyPhrases": [
        {
            "Score": 0.9991187453269958,
            "Text": "世間",
            "BeginOffset": 0,
            "EndOffset": 2
        },
        {
            "Score": 0.994473397731781,
            "Text": "少年時代",
            "BeginOffset": 8,
            "EndOffset": 12
        },
        {
            "Score": 0.9939662218093872,
            "Text": "自分",
            "BeginOffset": 14,
            "EndOffset": 16
        },
        {
            "Score": 0.9875624179840088,
            "Text": "心",
            "BeginOffset": 26,
            "EndOffset": 27
        },
        {
            "Score": 0.9364995956420898,
            "Text": "人の支えの中",
            "BeginOffset": 29,
            "EndOffset": 35
        },
        {
            "Score": 0.98807293176651,
            "Text": "現在の僕",
            "BeginOffset": 43,
            "EndOffset": 47
        },
        {
            "Score": 0.985284149646759,
            "Text": "弱音",
            "BeginOffset": 48,
            "EndOffset": 50
        },
        {
            "Score": 0.9150426983833313,
            "Text": "グチ",
            "BeginOffset": 56,
            "EndOffset": 58
        },
        {
            "Score": 0.9841071963310242,
            "Text": "他人の傷み",
            "BeginOffset": 64,
            "EndOffset": 69
        },
        {
            "Score": 0.9866365790367126,
            "Text": "ふり",
            "BeginOffset": 76,
            "EndOffset": 78
        },
        {
            "Score": 0.6099014282226562,
            "Text": "すぎ",
            "BeginOffset": 83,
            "EndOffset": 85
        },
        {
            "Score": 0.7314071655273438,
            "Text": "事",
            "BeginOffset": 89,
            "EndOffset": 90
        },
        {
            "Score": 0.9500252604484558,
            "Text": "今",
            "BeginOffset": 100,
            "EndOffset": 101
        },
        {
            "Score": 0.8240435719490051,
            "Text": "言葉さえも見つからぬまま",
            "BeginOffset": 106,
            "EndOffset": 118
        },
        {
            "Score": 0.6586101055145264,
            "Text": "時間",
            "BeginOffset": 118,
            "EndOffset": 120
        },
        {
            "Score": 0.716262936592102,
            "Text": "途方",
            "BeginOffset": 124,
            "EndOffset": 126
        },
        {
            "Score": 0.6114963889122009,
            "Text": "人よ",
            "BeginOffset": 134,
            "EndOffset": 136
        },
        {
            "Score": 0.5545666217803955,
            "Text": "君",
            "BeginOffset": 137,
            "EndOffset": 138
        },
        {
            "Score": 0.721443772315979,
            "Text": "に",
            "BeginOffset": 143,
            "EndOffset": 144
        },
        {
            "Score": 0.6975231766700745,
            "Text": "苦しみに似た",
            "BeginOffset": 144,
            "EndOffset": 150
        },
        {
            "Score": 0.6116013526916504,
            "Text": "想いを",
            "BeginOffset": 151,
            "EndOffset": 154
        },
        {
            "Score": 0.8357267379760742,
            "Text": "STAY",
            "BeginOffset": 159,
            "EndOffset": 163
        },
        {
            "Score": 0.7455344200134277,
            "Text": "何",
            "BeginOffset": 163,
            "EndOffset": 164
        },
        {
            "Score": 0.9078458547592163,
            "Text": "犠牲",
            "BeginOffset": 165,
            "EndOffset": 167
        },
        {
            "Score": 0.9965271353721619,
            "Text": "もの",
            "BeginOffset": 176,
            "EndOffset": 178
        },
        {
            "Score": 0.9996755123138428,
            "Text": "僕",
            "BeginOffset": 184,
            "EndOffset": 185
        },
        {
            "Score": 0.9795992374420166,
            "Text": "今",
            "BeginOffset": 189,
            "EndOffset": 190
        },
        {
            "Score": 0.5885325074195862,
            "Text": "君",
            "BeginOffset": 190,
            "EndOffset": 191
        },
        {
            "Score": 0.9860681295394897,
            "Text": "それ",
            "BeginOffset": 193,
            "EndOffset": 195
        },
        {
            "Score": 0.9740948677062988,
            "Text": "夢追い人",
            "BeginOffset": 205,
            "EndOffset": 209
        },
        {
            "Score": 0.9694126844406128,
            "Text": "旅路",
            "BeginOffset": 210,
            "EndOffset": 212
        },
        {
            "Score": 0.5604091286659241,
            "Text": "一体",
            "BeginOffset": 216,
            "EndOffset": 218
        },
        {
            "Score": 0.6506443619728088,
            "Text": "何",
            "BeginOffset": 218,
            "EndOffset": 219
        },
        {
            "Score": 0.516764760017395,
            "Text": "手",
            "BeginOffset": 220,
            "EndOffset": 221
        },
        {
            "Score": 0.9917513728141785,
            "Text": "嘘や矛盾",
            "BeginOffset": 228,
            "EndOffset": 232
        },
        {
            "Score": 0.8492306470870972,
            "Text": "両手",
            "BeginOffset": 233,
            "EndOffset": 235
        },
        {
            "Score": 0.9291658401489258,
            "Text": "それも人",
            "BeginOffset": 239,
            "EndOffset": 243
        },
        {
            "Score": 0.9886345863342285,
            "Text": "人",
            "BeginOffset": 256,
            "EndOffset": 257
        },
        {
            "Score": 0.9289801716804504,
            "Text": "君",
            "BeginOffset": 259,
            "EndOffset": 260
        },
        {
            "Score": 0.995627760887146,
            "Text": "これ",
            "BeginOffset": 268,
            "EndOffset": 270
        },
        {
            "Score": 0.8548830151557922,
            "Text": "恋",
            "BeginOffset": 272,
            "EndOffset": 273
        },
        {
            "Score": 0.8810998797416687,
            "Text": "STAY僕",
            "BeginOffset": 279,
            "EndOffset": 284
        },
        {
            "Score": 0.8819072246551514,
            "Text": "荷物",
            "BeginOffset": 297,
            "EndOffset": 299
        },
        {
            "Score": 0.9923756718635559,
            "Text": "君",
            "BeginOffset": 302,
            "EndOffset": 303
        },
        {
            "Score": 0.9759371280670166,
            "Text": "ドア",
            "BeginOffset": 307,
            "EndOffset": 309
        },
        {
            "Score": 0.7493122816085815,
            "Text": "STAY",
            "BeginOffset": 322,
            "EndOffset": 326
        },
        {
            "Score": 0.8759680390357971,
            "Text": "何",
            "BeginOffset": 326,
            "EndOffset": 327
        },
        {
            "Score": 0.9159817099571228,
            "Text": "犠牲",
            "BeginOffset": 328,
            "EndOffset": 330
        },
        {
            "Score": 0.9839121699333191,
            "Text": "もの",
            "BeginOffset": 340,
            "EndOffset": 342
        },
        {
            "Score": 0.9930424690246582,
            "Text": "それ",
            "BeginOffset": 348,
            "EndOffset": 350
        },
        {
            "Score": 0.9922454953193665,
            "Text": "僕",
            "BeginOffset": 351,
            "EndOffset": 352
        },
        {
            "Score": 0.5670811533927917,
            "Text": "もう",
            "BeginOffset": 359,
            "EndOffset": 361
        },
        {
            "Score": 0.5696842670440674,
            "Text": "君",
            "BeginOffset": 361,
            "EndOffset": 362
        },
        {
            "Score": 0.9778668284416199,
            "Text": "自分",
            "BeginOffset": 371,
            "EndOffset": 373
        },
        {
            "Score": 0.6204937100410461,
            "Text": "犠牲",
            "BeginOffset": 374,
            "EndOffset": 376
        },
        {
            "Score": 0.9709562063217163,
            "Text": "もの",
            "BeginOffset": 389,
            "EndOffset": 391
        },
        {
            "Score": 0.8189772963523865,
            "Text": "ただ一つ君",
            "BeginOffset": 393,
            "EndOffset": 398
        },
        {
            "Score": 0.9007982611656189,
            "Text": "いつ",
            "BeginOffset": 402,
            "EndOffset": 404
        },
        {
            "Score": 0.8109763264656067,
            "Text": "君",
            "BeginOffset": 407,
            "EndOffset": 408
        }
    ]
}

Language

言語判定です。もちろん日本語として解析されています。

image.png

API Response.json
{
    "Languages": {
        "LanguageCode": "ja",
        "Score": 0.9694656729698181
    }
}

PII

個人識別情報を検出できるようですが、日本語はまだ未対応のようです。

image.png

Sentiment

感情が以下の4つに分類されます。77%でポジティブとなりました。

Neutral(ニュートラル)
Positive(ポジティブ)
Negative(ネガティブ)
Mixed(混在)

image.png

API Response.json
{
    "Sentiment": {
        "Sentiment": "POSITIVE",
        "SentimentScore": {
            "Positive": 0.7775697112083435,
            "Negative": 0.015565356239676476,
            "Neutral": 0.19310088455677032,
            "Mixed": 0.013764000497758389
        }
    }
}

Syntax

名詞、形容詞、動詞などの構文解析(シンタックス)も日本語には対応していないようです。

image.png

まとめ

とりあえず分析してみると思わぬ見え方ができて面白いかも。
いろんな歌詞を試してみたい!

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1