14
13

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

スクレイピングした情報や画面キャプチャをSlackに投稿するBot

Last updated at Posted at 2019-07-13

1. 概要

Qiitaのマイページにある情報をスクレイピングしたり、画面キャプチャを撮ってSlackに投稿するBotをPythonで作ったので、覚書でのために投稿します。Pythonでコードを書くだけでできる簡単なBotです。

今回作るBotでできること

  • 特定のキーワードを検知したら、Webページからスクレイピングした情報をSlackにポストする。
  • 特定のキーワードを検知したら、Webページの画面キャプチャを撮り、画像をSlackにポストする。

作った背景

Qiitaに投稿した記事のいいね数が画面を開かなくてもわかるといいなと思って作りました。

環境

  • Python 3.7.3
  • slackclient 2.1.0
  • urllib3 1.25.3
  • beautifulsoup4 4.7.1
  • selenium 3.141.0

では早速Botを作る手順を紹介します。

2. SlackのBotを作ってAPIトークンを設定する

このURLにアクセスし、SlackのBotを作成してAPIトークンをコピペします。
APIトークンはBotの編集画面から確認できます。

続いて、コピペしたSlackbotのAPIトークンを環境変数に設定します。

export SLACK_TOKEN='APIトークン'

3. 必要なライブラリをインストールする

slackclient

slackclientとは、PythonでSlackAPIを扱えるようにするためのライブラリです。

$ pip3 install slackclient

BeautifulSoup

BeautifulSoupとは、Pythonでスクレイピング(Webサイトからデータを取得して任意の情報を抽出)するのに便利なライブラリです。

$ pip3 install beautifulsoup

selenium

Seleniumとは、Webブラウザを遠隔操作できるライブラリです。遠隔操作で、URLを開く、クリックする、スクロールする、文字を入力する、画面キャプチャを撮るなどの操作を行えます。

$ pip3 install selenium

4. 作業場所を作成し挨拶botで動作確認

作業場所はとてもシンプルです。

bot
└── qiita.py

作業場所ができたら、動作確認をするために簡単な挨拶botを作ってみましょう。
Helloという文字を検知したらメンション付きで反応してくれるボットです。

qiita.py
import os
import slack

# メッセージイベントとqiitabotをリンク
@slack.RTMClient.run_on(event='message')

def hellobot(**payload):
    data = payload['data']
    web_client = payload['web_client']
    rtm_client = payload['rtm_client']

    # Hello という文字を検知したら処理を開始
    if 'Hello' in data['text']:
        # 文字を検知したチャネルを取得
        channel_id = data['channel']
        # 投稿したユーザーを取得
        user = data['user']
        # 文字を検知したチャネルにメッセージを投稿
        web_client.chat_postMessage(
            channel=channel_id,
            # 投稿したユーザーにメンション
            text=f"""
                Hi <@{user}>!
            """
        )

# Botを起動する
slack_token = os.environ['SLACK_TOKEN']
rtm_client = slack.RTMClient(token=slack_token)
rtm_client.start()

コードを書いて保存したら、Botを起動しましょう。

$ python3 qiita.py

Botが起動したら、Helloと投稿してみましょう。
メンション付きで返信してくれたら成功です。

#5. スクレイピングした情報をSlackに投稿するBotを作る

それでは準備が整ったので、Qiitaからスクレイピングした情報をSlackに投稿するBotを作ります。スクレイピングする情報は赤枠で囲ったあたりにある情報です。

Botの機能

  • Slackでqiita リストという投稿を検知
  • Qiitaユーザー情報 > 投稿一覧 > 1P目から記事名記事URLいいね数をスクレイピングする
  • スクレイピングした情報をSlackに投稿する

コード

それではコードを書いていきます。

BeautifulSoupとurllibを追加でインポートしてください。

qiita.py
import urllib.request as req
from bs4 import BeautifulSoup

先ほど作成した挨拶botの記述(def qiitabot(**payload):以下のブロック)を削除し、新しいボットの記述を追加します。

qiita.py
def qiitabot(**payload):
    data = payload['data']
    web_client = payload['web_client']
    rtm_client = payload['rtm_client']

    url = 'https://qiita.com/qiita'
    res = req.urlopen(url)
    soup = BeautifulSoup(res, 'html.parser')
    list = soup.select('.media.ItemLink')

    if 'qiita リスト' in data['text']:
        channel_id = data['channel']

        for li in list:
            t = li.select_one(".ItemLink__title")
            title = t.string
            a = t.a
            href = a.attrs["href"]
            likelist = li.select(".ItemLink__status li")
            info = li.select_one(".ItemLink__info").text
            for i in likelist:
                i = 1
                likenum = likelist[0].text  

            web_client.chat_postMessage(
                channel=channel_id,
                text=f"""
:+1:*{likenum}* いいね! {info}
> {title}
> https://qiita.com{href}
                """
            )

コードを書いて保存したら、Botを起動します。

$ python3 qiita.py

Botが起動したら、qiita リストと投稿してみましょう。SlakにQiitaの記事を投稿してくれたら成功です。

#6. 画面をキャプチャし画像をSlackに投稿するBotを作る
続いて、Qiitaのページを画面キャプチャしSlackに投稿するBotを作ります。キャプチャするのは以下の画面です。

file.png

Botの機能

  • Slackでqiita キャプチャという投稿を検知
  • `Qiitaユーザー情報の画面をキャプチャする
  • キャプチャした画像をSlackに投稿する
    ※Firefoxで画面をキャプチャするので、Firefoxがインストールされていることが前提です。

コード

それではコードを書いていきます。
seleniumを追加でインポートしてください。

qiita.py
from selenium.webdriver import Firefox, FirefoxOptions

続いてコードを書いていきます。
前述の「スクレイピングした情報をSlackに投稿するBot」のif文にelifで追加します。

qiita.py
elif 'qiita キャプチャ' in data['text']:
    channel_id = data['channel']
    options = FirefoxOptions()
    options.add_argument('-headless')
    browser = Firefox(options=options)
    browser.get(url)
    browser.save_screenshot("qiita-mypage.png")
    web_client.files_upload(
        channels=channel_id,
        file="qiita-mypage.png"
    )

コードの全文は以下です。

qiita.py
import os
import slack
import urllib.request as req
from bs4 import BeautifulSoup
from selenium.webdriver import Firefox, FirefoxOptions

@slack.RTMClient.run_on(event='message')

def qiitabot(**payload):
    data = payload['data']
    web_client = payload['web_client']
    rtm_client = payload['rtm_client']

    url = 'https://qiita.com/qiita'
    res = req.urlopen(url)
    soup = BeautifulSoup(res, 'html.parser')
    list = soup.select('.media.ItemLink')

    if 'qiita リスト' in data['text']:
        channel_id = data['channel']
        for li in list:
            t = li.select_one(".ItemLink__title")
            title = t.string
            a = t.a
            href = a.attrs["href"]
            likelist = li.select(".ItemLink__status li")
            info = li.select_one(".ItemLink__info").text
            for i in likelist:
                i = 1
                likenum = likelist[0].text  

            web_client.chat_postMessage(
                channel=channel_id,
                text=f"""
:+1:*{likenum}* いいね! {info}
> {title}
> https://qiita.com{href}
                """
            )

    elif 'qiita キャプチャ' in data['text']:
        channel_id = data['channel']
        options = FirefoxOptions()
        options.add_argument('-headless')
        browser = Firefox(options=options)
        browser.get(url)
        browser.save_screenshot("qiita-mypage.png")
        web_client.files_upload(
            channels=channel_id,
            file="qiita-mypage.png"
        )

slack_token = os.environ['SLACK_TOKEN']
rtm_client = slack.RTMClient(token=slack_token)
rtm_client.start()

コードを書いて保存したら、Botを起動します。

$ python3 qiita.py

Botが起動したら、qiita リストと投稿してみましょう。作業場所にキャプチャした画像が保存され、Slackにファイルを投稿してくれたら成功です。
※2回目以降は生成した画面キャプチャは新しいものに置き換えらます。
※投稿まで少し時間がかかります。(数十秒くらい)

bot
├── qiita.py
└── qiita-mypage.png

7. さいごに

はじめてPythonを使いました。
いろいろ機能が豊富で面白いので、もっと勉強しようと思います。

8. 参考文献

Github: python-slackclient
書籍: Pythonによるスクレイピング&機械学習

14
13
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
13

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?