2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Everything (It's you)をComprehendしてみた

Last updated at Posted at 2022-02-14

Mr.Childrenの言わずと知れた名曲をComprehendに投入してみました。
ミスチル好きなものでして。

Amazon Comprehendとは

テキストを分析し、感情の判定やキーフレーズ検出などを行うことができる、機械学習を利用した自然言語処理(NLP)サービスです。コンソールから1分もかからずに分析できてしまいます。

解析されるインサイトは以下の6つ。

  • エンティティ
  • キーフレーズ
  • PII
  • 言語
  • 感情
  • 構文

リアルタイム解析を実行

image.png

スクリーンショット 2022-02-14 14.33.47.png

Input text に解析したい文章を入力しAnalyze
これだけです。たったこれだけで解析されちゃいます。Everything (It's you)の歌詞を入力し解析実行!

スクリーンショット 2022-02-14 14.37.21.png

解析結果

6つのインサイト

image.png

Entities

人、場所、位置などの情報に自動的に分類される情報。
STAY は人名と認識されたようです。

image.png

API Response.json
{
    "Entities": [
        {
            "Score": 0.6422388553619385,
            "Type": "DATE",
            "Text": "少年時代",
            "BeginOffset": 8,
            "EndOffset": 12
        },
        {
            "Score": 0.7727364897727966,
            "Type": "DATE",
            "Text": "今",
            "BeginOffset": 100,
            "EndOffset": 101
        },
        {
            "Score": 0.5865667462348938,
            "Type": "QUANTITY",
            "Text": "両手",
            "BeginOffset": 233,
            "EndOffset": 235
        },
        {
            "Score": 0.5952135920524597,
            "Type": "PERSON",
            "Text": "STAY",
            "BeginOffset": 322,
            "EndOffset": 326
        },
        {
            "Score": 0.5447555780410767,
            "Type": "QUANTITY",
            "Text": "一つ",
            "BeginOffset": 395,
            "EndOffset": 397
        }
    ]
}

Key phrases

「キーフレーズ」と分析されたフレーズとその信頼スコア
「世間」「少年時代」「自分」などが上位のようです。

image.png

API Response.json
{
    "KeyPhrases": [
        {
            "Score": 0.9991187453269958,
            "Text": "世間",
            "BeginOffset": 0,
            "EndOffset": 2
        },
        {
            "Score": 0.994473397731781,
            "Text": "少年時代",
            "BeginOffset": 8,
            "EndOffset": 12
        },
        {
            "Score": 0.9939662218093872,
            "Text": "自分",
            "BeginOffset": 14,
            "EndOffset": 16
        },
        {
            "Score": 0.9875624179840088,
            "Text": "心",
            "BeginOffset": 26,
            "EndOffset": 27
        },
        {
            "Score": 0.9364995956420898,
            "Text": "人の支えの中",
            "BeginOffset": 29,
            "EndOffset": 35
        },
        {
            "Score": 0.98807293176651,
            "Text": "現在の僕",
            "BeginOffset": 43,
            "EndOffset": 47
        },
        {
            "Score": 0.985284149646759,
            "Text": "弱音",
            "BeginOffset": 48,
            "EndOffset": 50
        },
        {
            "Score": 0.9150426983833313,
            "Text": "グチ",
            "BeginOffset": 56,
            "EndOffset": 58
        },
        {
            "Score": 0.9841071963310242,
            "Text": "他人の傷み",
            "BeginOffset": 64,
            "EndOffset": 69
        },
        {
            "Score": 0.9866365790367126,
            "Text": "ふり",
            "BeginOffset": 76,
            "EndOffset": 78
        },
        {
            "Score": 0.6099014282226562,
            "Text": "すぎ",
            "BeginOffset": 83,
            "EndOffset": 85
        },
        {
            "Score": 0.7314071655273438,
            "Text": "事",
            "BeginOffset": 89,
            "EndOffset": 90
        },
        {
            "Score": 0.9500252604484558,
            "Text": "今",
            "BeginOffset": 100,
            "EndOffset": 101
        },
        {
            "Score": 0.8240435719490051,
            "Text": "言葉さえも見つからぬまま",
            "BeginOffset": 106,
            "EndOffset": 118
        },
        {
            "Score": 0.6586101055145264,
            "Text": "時間",
            "BeginOffset": 118,
            "EndOffset": 120
        },
        {
            "Score": 0.716262936592102,
            "Text": "途方",
            "BeginOffset": 124,
            "EndOffset": 126
        },
        {
            "Score": 0.6114963889122009,
            "Text": "人よ",
            "BeginOffset": 134,
            "EndOffset": 136
        },
        {
            "Score": 0.5545666217803955,
            "Text": "君",
            "BeginOffset": 137,
            "EndOffset": 138
        },
        {
            "Score": 0.721443772315979,
            "Text": "に",
            "BeginOffset": 143,
            "EndOffset": 144
        },
        {
            "Score": 0.6975231766700745,
            "Text": "苦しみに似た",
            "BeginOffset": 144,
            "EndOffset": 150
        },
        {
            "Score": 0.6116013526916504,
            "Text": "想いを",
            "BeginOffset": 151,
            "EndOffset": 154
        },
        {
            "Score": 0.8357267379760742,
            "Text": "STAY",
            "BeginOffset": 159,
            "EndOffset": 163
        },
        {
            "Score": 0.7455344200134277,
            "Text": "何",
            "BeginOffset": 163,
            "EndOffset": 164
        },
        {
            "Score": 0.9078458547592163,
            "Text": "犠牲",
            "BeginOffset": 165,
            "EndOffset": 167
        },
        {
            "Score": 0.9965271353721619,
            "Text": "もの",
            "BeginOffset": 176,
            "EndOffset": 178
        },
        {
            "Score": 0.9996755123138428,
            "Text": "僕",
            "BeginOffset": 184,
            "EndOffset": 185
        },
        {
            "Score": 0.9795992374420166,
            "Text": "今",
            "BeginOffset": 189,
            "EndOffset": 190
        },
        {
            "Score": 0.5885325074195862,
            "Text": "君",
            "BeginOffset": 190,
            "EndOffset": 191
        },
        {
            "Score": 0.9860681295394897,
            "Text": "それ",
            "BeginOffset": 193,
            "EndOffset": 195
        },
        {
            "Score": 0.9740948677062988,
            "Text": "夢追い人",
            "BeginOffset": 205,
            "EndOffset": 209
        },
        {
            "Score": 0.9694126844406128,
            "Text": "旅路",
            "BeginOffset": 210,
            "EndOffset": 212
        },
        {
            "Score": 0.5604091286659241,
            "Text": "一体",
            "BeginOffset": 216,
            "EndOffset": 218
        },
        {
            "Score": 0.6506443619728088,
            "Text": "何",
            "BeginOffset": 218,
            "EndOffset": 219
        },
        {
            "Score": 0.516764760017395,
            "Text": "手",
            "BeginOffset": 220,
            "EndOffset": 221
        },
        {
            "Score": 0.9917513728141785,
            "Text": "嘘や矛盾",
            "BeginOffset": 228,
            "EndOffset": 232
        },
        {
            "Score": 0.8492306470870972,
            "Text": "両手",
            "BeginOffset": 233,
            "EndOffset": 235
        },
        {
            "Score": 0.9291658401489258,
            "Text": "それも人",
            "BeginOffset": 239,
            "EndOffset": 243
        },
        {
            "Score": 0.9886345863342285,
            "Text": "人",
            "BeginOffset": 256,
            "EndOffset": 257
        },
        {
            "Score": 0.9289801716804504,
            "Text": "君",
            "BeginOffset": 259,
            "EndOffset": 260
        },
        {
            "Score": 0.995627760887146,
            "Text": "これ",
            "BeginOffset": 268,
            "EndOffset": 270
        },
        {
            "Score": 0.8548830151557922,
            "Text": "恋",
            "BeginOffset": 272,
            "EndOffset": 273
        },
        {
            "Score": 0.8810998797416687,
            "Text": "STAY僕",
            "BeginOffset": 279,
            "EndOffset": 284
        },
        {
            "Score": 0.8819072246551514,
            "Text": "荷物",
            "BeginOffset": 297,
            "EndOffset": 299
        },
        {
            "Score": 0.9923756718635559,
            "Text": "君",
            "BeginOffset": 302,
            "EndOffset": 303
        },
        {
            "Score": 0.9759371280670166,
            "Text": "ドア",
            "BeginOffset": 307,
            "EndOffset": 309
        },
        {
            "Score": 0.7493122816085815,
            "Text": "STAY",
            "BeginOffset": 322,
            "EndOffset": 326
        },
        {
            "Score": 0.8759680390357971,
            "Text": "何",
            "BeginOffset": 326,
            "EndOffset": 327
        },
        {
            "Score": 0.9159817099571228,
            "Text": "犠牲",
            "BeginOffset": 328,
            "EndOffset": 330
        },
        {
            "Score": 0.9839121699333191,
            "Text": "もの",
            "BeginOffset": 340,
            "EndOffset": 342
        },
        {
            "Score": 0.9930424690246582,
            "Text": "それ",
            "BeginOffset": 348,
            "EndOffset": 350
        },
        {
            "Score": 0.9922454953193665,
            "Text": "僕",
            "BeginOffset": 351,
            "EndOffset": 352
        },
        {
            "Score": 0.5670811533927917,
            "Text": "もう",
            "BeginOffset": 359,
            "EndOffset": 361
        },
        {
            "Score": 0.5696842670440674,
            "Text": "君",
            "BeginOffset": 361,
            "EndOffset": 362
        },
        {
            "Score": 0.9778668284416199,
            "Text": "自分",
            "BeginOffset": 371,
            "EndOffset": 373
        },
        {
            "Score": 0.6204937100410461,
            "Text": "犠牲",
            "BeginOffset": 374,
            "EndOffset": 376
        },
        {
            "Score": 0.9709562063217163,
            "Text": "もの",
            "BeginOffset": 389,
            "EndOffset": 391
        },
        {
            "Score": 0.8189772963523865,
            "Text": "ただ一つ君",
            "BeginOffset": 393,
            "EndOffset": 398
        },
        {
            "Score": 0.9007982611656189,
            "Text": "いつ",
            "BeginOffset": 402,
            "EndOffset": 404
        },
        {
            "Score": 0.8109763264656067,
            "Text": "君",
            "BeginOffset": 407,
            "EndOffset": 408
        }
    ]
}

Language

言語判定です。もちろん日本語として解析されています。

image.png

API Response.json
{
    "Languages": {
        "LanguageCode": "ja",
        "Score": 0.9694656729698181
    }
}

PII

個人識別情報を検出できるようですが、日本語はまだ未対応のようです。

image.png

Sentiment

感情が以下の4つに分類されます。77%でポジティブとなりました。

Neutral(ニュートラル)
Positive(ポジティブ)
Negative(ネガティブ)
Mixed(混在)

image.png

API Response.json
{
    "Sentiment": {
        "Sentiment": "POSITIVE",
        "SentimentScore": {
            "Positive": 0.7775697112083435,
            "Negative": 0.015565356239676476,
            "Neutral": 0.19310088455677032,
            "Mixed": 0.013764000497758389
        }
    }
}

Syntax

名詞、形容詞、動詞などの構文解析(シンタックス)も日本語には対応していないようです。

image.png

まとめ

とりあえず分析してみると思わぬ見え方ができて面白いかも。
いろんな歌詞を試してみたい!

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?