LoginSignup
1
2

More than 3 years have passed since last update.

vue-wordcloudでツイートを検索して紐づくプロフィールに何が書いてあるかの傾向を調べるWebアプリを作ってみた

Last updated at Posted at 2020-09-18

1.っていうよく見るアレです。

アレってなんだよっていう方のために結果を先にお見せします。

図1.PNG

ツイートを検索ワードで検索すると、ヒットしたツイートしてる人のプロフィールの単語をWord Cloudのタグクラウドで表示します。

出現回数が多い文字が大きくなります。

作り方は簡単みたいですが、調べるとだいたいPythonです。

今、Vue.jsとJava(Spring Boot)で開発してるので、それで作れないかな~と思ってちょっとWebアプリを作ってみました。

今回はツイートの内容じゃなくて、ツイートの内容からプロフィールの内容をひっぱってきてるのでそこが少しトリッキーかも。

Webアプリ作成日数:2日
Qiita記事作成:2日

Qiita記事作成のほうがしんどい。

何でこんなに長いタイトルになってしまったのか。

Webアプリの動作の流れはこんな感じです。



TwitterのAPIでツイートのプロフィール情報取得

プロフィール情報の形態素解析

可視化



形態素解析とは?

文章を単語に分割する作業って感じですが私はそれ以上のことはわからないのでみなさんの方がきっと詳しくなります。

2.環境

Vue.js:2.6.12
Spring Boot:v2.3.3
Java:AdoptOpenJDK:11.0.6
Kuromoji:0.9.0
vue-wordcloud:1.1.1
axios:0.20.0

性懲りもなくVue.jsをフロント、Spring BootをサーバサイドのAPIとします。

大まかなディレクトリ構造はこんな感じです。

┠ src
┃  ┗ main
┃     ┗ java/app/myapp
┃        ┠ common
┃        ┃  ┗ HttpAccess.java
┃        ┠ controller
┃        ┃  ┗ TwitterAnalysisRestController.java
┃        ┠ entity
┃        ┃  ┗ VueWordCloudEntity.java
┃        ┠ service
┃        ┃  ┗ TwitterAnalysisService.java
┃        色々
┃
┠ web
┃  ┠ 色々
┃  ┠ src
┃  ┃  ┠ 色々
┃  ┃  ┠ router
┃ ┃  ┃  ┗ index.js
┃  ┃  ┠ views
┃  ┃  ┃  ┗ TwitterAnalysis.vue
┃  ┃  ┃
┃  ┃  色々
┃  色々
┃
┠ build.gradle
色々

3.手順

3-1.前提

Spring Boot のプロジェクトが作成済。

3-2.TwitterのAPI利用申請

まず、Twitter側にTwitterのAPI利用申請をする必要があります。

Twitterのアカウントを持ってる前提です。

親切に解説してくれてるサイトがあるので、利用申請はこちらを参考にしてください。
2020年度版 Twitter API利用申請の例文からAPIキーの取得まで詳しく解説

情報は日々変わるのですでに変わってるところがあるかもしれませんが、多分もっと簡単になってるはずです。

やることは、Twitter側からのいくつかの質問に答えるだけです。

どうみても英語で書くことを強いられる申請画面なのですが、実は日本語でもよかったりして…

質問に答えたら承認待ちかな…と思ったらそんなことはなく、すぐにトークン(Bearer Token)の表示画面に行けました。

このトークンとあとキーをコピーしておけばOKです。

ちょっと前は承認待ちに数日かかっていたようです。

3-3.Javaの実装

まずはTwitterのAPIを利用してプロフィール情報を取得します。

Twitter4Jというライブラリを使えば便利なようですが、今回は使ってません。

理由は特にありません。

APIのURLはこんな感じです。

API、最近新しくなったみたいですね。

https://api.twitter.com/2/tweets/search/recent?expansions=author_id&user.fields=description&max_results=100&query=<検索キーワード>
今回使うパラメータ 内容
expansions=author_id ツイートの文章と同時に、そのツイートをした人の情報を取得するために指定
user.fields=description 取得する情報に、ツイートをした人のプロフィールの文章を含めるために指定
max_results=100 最大取得件数
query=<検索ワード> ツイートに対する検索ワード

詳しくは公式サイト

で、APIを利用して情報を取得するのはこんな感じ。

トークンには上記で取得したBearer Tokenを指定します。

TwitterAnalysisService.java
String urlString = "https://api.twitter.com/2/tweets/search/recent?expansions=author_id&user.fields=description&max_results=100";

String method = "GET";
String bearerToken = <トークン>;

HttpAccess httpAccess = new HttpAccess();
String response = httpAccess.requestHttp(urlString, method, bearerToken, <検索ワード>);
HttpAccess.java
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;

public class HttpAccess {

    public String requestHttp(String urlString, String method, String bearerToken, String query) {

        String result = null;
        String urlStringFull = null;

        if (query == null || query.isEmpty()) return result;

        try {
            urlStringFull = urlString + "&query=" + URLEncoder.encode(query, "UTF-8");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }

        if (urlStringFull == null) return result;

        HttpURLConnection  urlConn = null;
        InputStream in = null;
        BufferedReader reader = null;

        try {

            URL url = new URL(urlStringFull);

            urlConn = (HttpURLConnection) url.openConnection();
            urlConn.setRequestMethod(method);
            urlConn.setRequestProperty("Authorization","Bearer " + bearerToken);
            urlConn.connect();

            int status = urlConn.getResponseCode();
            if (status == HttpURLConnection.HTTP_OK) {

                in = urlConn.getInputStream();

                reader = new BufferedReader(new InputStreamReader(in));

                StringBuilder output = new StringBuilder();
                String line;

                while ((line = reader.readLine()) != null) {
                    output.append(line);
                }

                result = output.toString();
            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (reader != null) {
                    reader.close();
                }
                if (urlConn != null) {
                    urlConn.disconnect();
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

        return result;
    }
}

次に形態素解析ですが、Javaでやりたい場合はKuromojiが便利です。

build.gradle ファイルに一行追加するだけです。

build.gradle
dependencies {
~略~
    implementation 'com.atilika.kuromoji:kuromoji-ipadic:0.9.0'
~略~
}

あと、データをどういう形式で返すかというと、ビューの方でvue-wordcloudが「name」と「value」をキーに持つオブジェクトの配列をデータとして扱うので、「name」と「value」をキーに持つオブジェクトの配列をJSONで返します。
※キーの名称は変更可能

「name」には形態素解析した結果の単語、「value」にはその単語が何回出現したかを入れます。

今回、名詞のみを対象にするとして、上記のAPIへのアクセスに加えて形態素解析を行い、「name」と「value」をフィールドに持つオブジェクトを作成したのが以下の通りです。

形態素解析にはTokenizerクラスを使います。

TwitterAnalysisService.java
import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;

import com.atilika.kuromoji.ipadic.Token;
import com.atilika.kuromoji.ipadic.Tokenizer;
import com.fasterxml.jackson.core.JsonProcessingException;
import com.fasterxml.jackson.databind.JsonNode;
import com.fasterxml.jackson.databind.ObjectMapper;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;

import app.myapp.common.HttpAccess;
import app.myapp.entity.VueWordCloudEntity;

@Service
public class TwitterAnalysisService {

    public List<VueWordCloudEntity> analysisTwitterProfileByQuery(String query) {

        List<VueWordCloudEntity> result = new ArrayList<>();

        String urlString = "https://api.twitter.com/2/tweets/search/recent?expansions=author_id&user.fields=description&max_results=100";

        String method = "GET";
        String bearerToken = <トークン>;

        HttpAccess httpAccess = new HttpAccess();
        String response = httpAccess.requestHttp(urlString, method, bearerToken, query);

        if (response == null) return result;

        ObjectMapper mapper = new ObjectMapper();
        JsonNode root = null;

        try {
            root = mapper.readTree(response);
        } catch (JsonProcessingException e) {
            e.printStackTrace();
        }

        if (root == null || root.get("meta").get("result_count").asInt() == 0) {
            return result;
        }

        Tokenizer tokenizer = new Tokenizer();
        List<Token> tokens = new ArrayList<>();

        JsonNode users = root.get("includes").get("users");

        for(int i = 0; i < users.size(); i++) {
            if (users.get(i).get("description") != null) {
                tokens.addAll(tokenizer.tokenize(users.get(i).get("description").asText()));
            }
        }

        List<VueWordCloudEntity> vueWordCloudEntityList = new ArrayList<>();
        tokens.stream()
                .filter(x -> x.getPartOfSpeechLevel1().equals("名詞"))
                .map(x -> x.getSurface())
                .collect(Collectors.groupingBy(x -> x, Collectors.counting()))
                .forEach((k, v) -> {
                    VueWordCloudEntity vueWordCloudEntity = new VueWordCloudEntity();
                    vueWordCloudEntity.setName(k);
                    vueWordCloudEntity.setValue(v);
                    vueWordCloudEntityList.add(vueWordCloudEntity);
                });

        result = vueWordCloudEntityList;

        return result;
    }
}
VueWordCloudEntity.java
import lombok.Data;

@Data
public class VueWordCloudEntity {

    private String name;
    private Long value;
}
TwitterAnalysisRestController.java
import java.util.List;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.http.HttpHeaders;
import org.springframework.http.HttpStatus;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import lombok.RequiredArgsConstructor;
import app.myapp.entity.VueWordCloudEntity;
import app.myapp.service.TwitterAnalysisService;

@RestController
@RequiredArgsConstructor
@RequestMapping("/api")
public class TwitterAnalysisRestController {

    @Autowired
    private TwitterAnalysisService twitterAnalysisService;

    @GetMapping("/twitter/analysis/profile/by/{query}")
    public ResponseEntity<List<VueWordCloudEntity>> analysisTwitterProfileByQuery(
            @PathVariable String query) {

        List<VueWordCloudEntity> result
                = twitterAnalysisService.analysisTwitterProfileByQuery(query);

        // テストアプリのためここでCORS対応
        HttpHeaders headers = new HttpHeaders();
        headers.add("Access-Control-Allow-Credentials", "true");
        headers.add("Access-Control-Allow-Origin", "http://localhost:<Vue.js実行環境ポート番号>");

        return new ResponseEntity<>(result, headers, HttpStatus.OK);
    }
}

きっとJavaでTwitter4Jを使わない場合のもっと簡単なやり方があるはず!

どこかにあるよきっとそんなサンプル。

今回は残念、私のサンプルでした。

※ソースコードは「動作する」優先です、という言い訳をしてみる…

3-4.Vue.jsの実装

こっちはvue-wordcloudをインストールしてvue-wordcloud公式のソースをほぼコピペするだけなので簡単です。

vue-cliのGUIでプロジェクトを作成して上記のディレクト構造の場所へ配置します。

その後、vue-cliのGUIでvue-wordcloudをインストールします。

あ、あとaxiosも。

あとは、公式のサンプルをコピペし、ちょこっと直してSpring BootのAPIからデータを取得します。

TwitterAnalysis.vue
<template>
    <div id="twitter-analysis">
        <input v-model="query" placeholder="キーワードを入力してください" style="width:400px;">
        <button @click="analyzeProfile" style="margin-left:10px;">解析</button>
        <wordcloud
            :data="analyzedWords"
            nameKey="name"
            valueKey="value"
            color="Accent"
            :showTooltip="true"
            :wordClick="wordClickHandler">
        </wordcloud>
    </div>
</template>

<script>
import wordcloud from 'vue-wordcloud'
import axios from 'axios'
axios.defaults.withCredentials = true

export default {
    name: 'TwitterAnalysis',
    components: {
        wordcloud
    },
    data() {
        return {
            query: '',
            analyzedWords: [],
        }
    },
    methods: {
        wordClickHandler(name, value, vm) {
            console.log('wordClickHandler', name, value, vm);
        },
        analyzeProfile: async function () {
            if (this.query == null || this.query === '') return
            await axios.get('http://localhost:<Spring Boot実行環境ポート番号>/api/twitter/analysis/profile/by/'
                    + encodeURIComponent(this.query))
                .then(res => {
                    if (res.data != null) {
                        this.analyzedWords = res.data
                    }
                })
                .catch(err => {
                    alert(err + ' エラーです。')
                })
        },
    },
}
</script>

router/index.js
import Vue from 'vue'
import VueRouter from 'vue-router'

Vue.use(VueRouter)

const routes = [
  {
    path: '/',
    name: 'TwitterAnalysis',
    component: () => import(/* webpackChunkName: "twitteranalysis" */ '../views/TwitterAnalysis.vue')
  },
]

const router = new VueRouter({
  mode: 'history',
  routes
})

export default router

これで
http://localhost:<Vue.js実行環境ポート番号>/
にアクセスします。

図2.PNG

検索ワードを入力して解析ボタンを押すと

図3.PNG

成功!するはず。

見ると、スラッシュとかhttpとかどうでもいい単語があるので、こういうのはきっと除外するんだと思います。

このアプリで何か面白い傾向がわかるかな~と思ったんですが、あんまりわからない!

そもそも、そもそもな感じ。

色々勉強が必要みたいですねぇ…

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2