2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【LINE bot】Pythonで各種ポイントキャンペーンをリアルタイムで拾ってくる『おしえて!ポイ活博士』作りました

Last updated at Posted at 2025-01-12

今回開発したのがこちら。『教えて!ポイ活先生』

楽天、PayPay、dポイント、Vポイント、Pontaの5大経済圏の各種サービスのプレスリリースやキャンペーンページを定期的にスクレイピングして、リアルタイムで実施中のポイント高還元情報やお店のキャンペーンなどを集めることができるものになっております。

なかなかサービス横断的に色んなポイントの高還元情報を集めてきたり、PayPayや楽天などサービス側からではなく、キャンペーンをお店や自治体名から検索できるのは今まであまりなかったんじゃないかなと思って作りました。

Screenshot 2025-01-12 at 22.20.05.png

ここから友達追加できます。

使い方は簡単。

使い方

①リッチメニューからポイントで探す

S__38814183.jpg

リッチメニューを押すとポイントからキャンペーンを探すことができます。ちなみに手動ですが「PayPayのすべて」「Pontaのすべて」「Vポイントのすべて」と打ち込んでくれれば全ての実施中のキャンペーンが取得できます(dポイントと楽天ポイントは量が多すぎた。)

②お店やサービス名で探す

S__38814189.jpg

例えば「マルエツ」「ローソン」「眼鏡市場」とか打ってくれれば、そのお店でやっているポイントキャンペーンを拾ってきます。

③住んでいる街から探す

S__38814214.jpg

例えば「葛飾区」「横浜市」とか打ってくれれば、その街・自治体やっているキャンペーンや商品券など拾ってきます。

④「商品券」「自治体」

S__38814216.jpg

なかなか場所を指定しても結果返ってこなかったりするので、「商品券」「自治体」とだけ打ってくれても、それぞれ場所を絞り込まず実施中のキャンペーンを拾ってきます。住んでいる自治体だけでなく、近場のキャンペーンとか拾ってくることができると思います。

⑤「博士に聞くポイ活のヒント」

S__38814217.jpg

これはおまけ要素です。ポイ活のお得豆知識を教えてくれます。パターンの数結構用意したので、おそらく全部出すのは結構時間がかかるはずです。これもいろいろな情報をスクレイピングしつつ集めたりしました。

作った動機

まず個人的な動機として、色んなポイントサービスを横断してオトク情報を取得するのって難しいなっていうのを日々感じていたので、年末年始の時間ある時に裏側のコードをまず組むことにしました。

ただインターフェースをアプリとかサイトにするよりかは、入り口をLINEっていう日常生活に密着しているものにして、そこから色々なポイントサービスの情報にアクセスできるのがいいかと思ってLineのAPIで作ることに。かつ欲しい情報を送ったら必要な情報だけ取ってくるっていうパーソナライゼーションもポイ活みたいな活動とは親和性が高いのかなと思ったのが、今回の仕様に落ちついた理由です。

あとLINEなので、淡々と返すだけよりもちょっと可愛いおじさんと擬似的にコミュニケーション取ってるような感じが面白いかな、みたいなところ。

開発

Line Messaging Api 部分

Python
from flask import Flask, request, abort
from linebot import LineBotApi, WebhookHandler
from linebot.exceptions import InvalidSignatureError
from linebot.models import MessageEvent, TextMessage, TextSendMessage
import os
from dotenv import load_dotenv
from response_handler import generate_reply, generate_all_reply

from localpoint import search_local, search_gift, local_campaign
from search import search_campaign_by_name
from tips_handler import reply_tips

# 環境変数をロード
load_dotenv()

LINE_CHANNEL_ACCESS_TOKEN = os.getenv("LINE_CHANNEL_ACCESS_TOKEN")
LINE_CHANNEL_SECRET = os.getenv("LINE_CHANNEL_SECRET")

line_bot_api = LineBotApi(LINE_CHANNEL_ACCESS_TOKEN)
handler = WebhookHandler(LINE_CHANNEL_SECRET)

app = Flask(__name__)

@app.route("/callback", methods=["POST"])
def callback():
    signature = request.headers["X-Line-Signature"]
    body = request.get_data(as_text=True)

    # デバッグ用ログ
    print(f"Request body: {body}")
    print(f"Signature: {signature}")

    try:
        handler.handle(body, signature)
    except InvalidSignatureError:
        abort(400)

    return "OK"

@handler.add(MessageEvent, message=TextMessage)
def handle_message(event):
    user_message = event.message.text
    reply_message = ""  # 初期化

    if len(user_message) < 2:
        reply_message = """お、何か聞きたいことがあるのか。\n\nそれならリッチメニューから「ポイントで探す」こともできるし、気になるスーパーやサービスの名前(例:マルエツ、ファミマ、モスバーガー)をポチッと打ち込んでくれてもOKじゃ!\n\nさらに住んでいる町の名前を打ってくれれば、自治体とタイアップしたキャンペーンやポイント還元中の商品券も探してくるぞ。「商品券」とただ打ち込んでくれるだけでもよいのじゃ。さぁ今日もお得にポイ活を楽しむのじゃよ"""

    elif "豆知識" in user_message:
        reply_message = reply_tips()

    elif "すべて" in user_message:
        reply_message = generate_all_reply(user_message)


    elif user_message.endswith(("", "", "", "")):
        reply_message = search_local(user_message)

    elif "自治体" in user_message:
        reply_message = local_campaign()


    elif "商品券" in user_message:
        reply_message = search_gift()

    # キーワードが含まれる場合(楽天、PayPayなど)
    elif any(keyword in user_message for keyword in ["楽天", "PayPay", "paypay", "Vポイント", "dポイント", "ponta"]):
        reply_message = generate_reply(user_message)
    # それ以外の場合
    else:
        reply_message = search_campaign_by_name(user_message)

    line_bot_api.reply_message(
        event.reply_token,
        TextSendMessage(text=reply_message)
    )

if __name__ == "__main__":
    port = int(os.getenv("PORT", 5000))  # HerokuのPORT環境変数を取得
    app.run(host="0.0.0.0", port=port)       

スクレイピングで一番難しかったのが、dポイント。というのもサイトが、Javascriptで動的に生成されてる上に、記事のidなども動的にアクセスするたびに変わるんです。かつ全部見るには「もっと見る」ボタンでexpandする形になってて、それも色んな方法試したのですが、うまい具合に情報を綺麗に取ってくることはできませんでした。(なぜかリンクだけとれてタイトルが取れなかったり、途中で切り上げちゃったり)

スクレイピング部分

Python
from selenium import webdriver
from selenium.webdriver.support.ui import Select
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time


def fetch_dpoint_campaign_data():
# ChromeDriverの設定
    driver = webdriver.Chrome()

    # URLにアクセス
    url = "https://dpoint.docomo.ne.jp/campaign/index.html"
    driver.get(url)

    results = []  # 結果を格納するリスト

    try:
        # タブをスクロールしてクリック可能にする
        second_tab = WebDriverWait(driver, 10).until(
            EC.presence_of_element_located((By.CSS_SELECTOR, "#selectSecond"))
        )
        driver.execute_script("arguments[0].scrollIntoView();", second_tab)  # 要素までスクロール
        time.sleep(1)  # 少し待つ
        driver.execute_script("arguments[0].click();", second_tab)  # JavaScriptでクリック

        # セレクトボックスで2番目のオプションを選択
        select = Select(second_tab)
        select.select_by_index(1)  # 2番目のオプション
        time.sleep(10)  # コンテンツがロードされるまで待つ

        for i in range(1, 51):
            selector = f"#dpc_campaign_item_{i:03} > div.campaign_detail > div.campaign_title > p"
            link_selector = f"#dpc_campaign_item_{i:03d}"
            period_selector = f"#dpc_campaign_item_{i:03d} > div.campaign_detail > p"

            try:
                # 要素を取得
                element = WebDriverWait(driver, 10).until(
                    EC.presence_of_element_located((By.CSS_SELECTOR, selector))
                )
                # 要素のテキストを取得
                text = element.text

                link_element = driver.find_element(By.CSS_SELECTOR, link_selector)
                link = link_element.get_attribute("href")

                period_element = driver.find_element(By.CSS_SELECTOR, period_selector)
                period = period_element.text

                # リスト形式で追加
                results.append([f"dポイント", text, link, period])
            except Exception as e:
                print(f"Item {i}: 要素が見つかりませんでした({e})")

    finally:
        # ブラウザを閉じる
        driver.quit()

    # 結果をリスト形式で出力
    print(results)
    return results

工夫した場所

dポイントサイト以外は実施中のキャンペーンしかないのでスクレイピングするたびに上書きすればいいのですが、dポイントに関しては新着の情報を確実に取れる上位50件だけ取るようにして、それまでにスクレイピングしたものもどんどんスタックしていくものの、日付でみて過去分は削除するというコードを組みました。

Python
def filter_campaigns_in_json(filename):
    today = datetime.today().date()
    try:
        with open(filename, "r", encoding="utf-8") as file:
            data = json.load(file)
        
        filtered_data = []
        for campaign in data:
            if campaign[0] == "dポイント":
                # 日付のフォーマットを分解し、終了日を取得
                try:
                    date_range = campaign[3]  # "2025/01/04 〜 2025/02/16" の形式
                    end_date_str = date_range.split("")[1].strip()  # 終了日を取得
                    end_date = datetime.strptime(end_date_str, "%Y/%m/%d").date()

                    # 終了日が今日以前ならスキップ、それ以外は追加
                    if end_date >= today:
                        filtered_data.append(campaign)
                except Exception as e:
                    print(f"Error processing campaign: {campaign}, Error: {e}")

        return filtered_data

    except FileNotFoundError:
        print(f"ファイル {filename} が見つかりませんでした。")
        return []
    except json.JSONDecodeError:
        print(f"ファイル {filename} の内容が正しいJSON形式ではありませんでした。")
        return []

そうやって取ってきたスクレイピングの情報(jsonファイルに落としてます)をフィルタリングしているのが下記のコードになります。

Python
import random
from import_json import campaigns_list
from textwrap import dedent

def generate_reply(user_message):
    """
    ユーザーのメッセージに応じた返信を生成する。
    """
    def format_campaign_response(platform_name, campaign_url):
        # 条件に応じたメッセージの準備
        header = f"おっ、{platform_name}のキャンペーンが気になるんじゃな?任せておけ!\n"
        overview = "今おすすめの実施中キャンペーンを5つピックアップしてきたぞい。ほれ、これじゃ!\n"
        #footer = f"\n\nもし『{platform_name}のすべて』と打ち込んでくれれば、ワシが全部のキャンペーンをここにズラッと並べてやるからのう。\n\nスーパー名や自治体名でも探せるから、気軽に聞いてくれい!\n\n"
        
        # footer に条件を追加
        if platform_name in ["PayPay", "Vポイント","Ponta"]:
            footer = f"\n\nもし『{platform_name}のすべて』と打ち込んでくれれば、ワシが全部のキャンペーンをここにズラッと並べてやるからのう。\n\nスーパー名や自治体名でも探せるから、気軽に聞いてくれい!\n\n\n"
        else:
            footer = "\n\nさらに知りたい情報があれば、気軽に聞いてくれい!\n\n"

        # キャンペーン選択
        #"if "すべて" in user_message:
            #selected_campaigns = [c for c in campaigns_list if c[0] == platform_name]
        selected_campaigns = random.sample(
            [c for c in campaigns_list if c[0] == platform_name],
            min(5, len([c for c in campaigns_list if c[0] == platform_name])),
        )

        # キャンペーンのフォーマット
        campaign_text = "\n\n".join([f"{c[1]}\n{c[2]}" for c in selected_campaigns])
        campaign_text += f"\n\n\n\n ⚫︎{platform_name}の全てのキャンペーンはこちら:\n {campaign_url}\n"

        # 応答メッセージの組み立て
        return dedent(f"""
            {header}
{overview}
{campaign_text}
{footer}
        """).strip()

    # 各プラットフォームに応じた応答を返す
    if "PayPay" in user_message or "paypay" in user_message:
        return format_campaign_response("PayPay", "https://paypay.ne.jp/event/")
    elif "楽天ポイント" in user_message:
        return format_campaign_response("楽天ポイント", "https://pointcard.rakuten.co.jp/campaign/")
    elif "Vポイント" in user_message:
        return format_campaign_response("Vポイント", "https://cpn.tsite.jp/list/all")
    elif "dポイント" in user_message:
        return format_campaign_response("dポイント", "https://dpoint.docomo.ne.jp/campaign/index.html")
    elif "Ponta" in user_message or "ponta" in user_message:
        return format_campaign_response("Ponta", "https://point.recruit.co.jp/point/?tab=campaign")

    # 何も該当しない場合の応答
    return "申し訳ないが、そのメッセージに関連するキャンペーン情報は見つからんかったぞい!また別の質問をしてみてくれい。"

これは自治体や商品券用のコード。末尾が「市・区・町・村」の時に条件分岐して下記の関数を呼び出しているのですが、楽天市場、眼鏡市場、都市ガス、都市電気というキーワードが入ってるとおかしな挙動をしてしまうので、exclueded_keywordに入れて除外するようにしてます。

Python
from import_json import campaigns_list 


def search_local(user_message):
    # 入力に基づくキャンペーン検索
    result = [
        [campaign[0], campaign[1], campaign[2]]  # キャンペーン名、詳細、リンクを抽出
        for campaign in campaigns_list
        if user_message in campaign[1]
    ]
    
    # フォーマット結果
    if result:
        formatted_results = "\n".join(
            [
                f"\n{campaign[0]}: {campaign[1]}\n{campaign[2]}"
                for campaign in result
            ]
        )
        return f"おっ、{user_message}ではこんなキャンペーンがあるようじゃぞ!これは活用せん手はないのう。詳細や条件はリンクからしっかり確認してくれい!:\n\n{formatted_results}"
    else:
        return f"おっ{user_message}について知りたいんじゃな?ちょっと待っとれ\n\n……ふむふむ、調べてみたが、今のところ自治体と提携したキャンペーンや商品券は見当たらんようじゃ。残念じゃのう。\n\nとはいえ、最近は大きな自治体を中心にこういったキャンペーンが増えてきとるから、定期的にチェックするのが吉じゃぞ!\n\nちなみに「自治体」と打ってくれれば今実施中の自治体キャンペーンを送ってやるぞ"
        

def search_gift():
    # 商品券に関するキャンペーン検索
    results = [campaign for campaign in campaigns_list if "商品券" in campaign[1]]
    
    if results:
        formatted_results = "\n".join(
            [f"\n\n{campaign[0]}: {campaign[1]}\n{campaign[2]}" for campaign in results]
        )
        return f"お、自治体商品券についてじゃな。\n\n調べてみたところ、今は下記のものが実施中じゃ{formatted_results}"
    else:
        return "お、自治体商品券についてじゃな。しかし、現在該当するキャンペーンは見つからなかったぞ。"


def local_campaign():
    excluded_keywords = ['楽天市場', '眼鏡市場', '都市電気', '都市ガス']
    related_campaigns = [
        [campaign[0], campaign[1], campaign[2]]
        for campaign in campaigns_list
        if any(keyword in campaign[1] for keyword in ['', '', '', ''])
        and all(excluded not in campaign[1] for excluded in excluded_keywords)
        ]
    if related_campaigns:
        formatted_related = "\n".join(
            [
                f"\n\n{campaign[0]}: {campaign[1]}\n{campaign[2]}"
                for campaign in related_campaigns
            ]
        )
    return f"おっ、自治体でやっておるキャンペーンについて知りたいんじゃな?ちょっと待っとれ\n\n……ふむふむ、今は下記のものが実施中じゃ{formatted_related}"

スーパーやサービス名で絞り込む用のコード

Python
rom import_json import campaigns_list 


def search_campaign_by_name(keyword):
    """
    キーワードに基づいてキャンペーンを検索し、結果をポイントごとに整形して返す。
    """
    # 条件に一致するキャンペーンを抽出
    result = [
        [campaign[0], campaign[1], campaign[2]]  # ポイント名、キャンペーン名、リンクを抽出
        for campaign in campaigns_list
        if keyword in campaign[1]  # キャンペーン名にキーワードが含まれるかチェック
    ]

    # 結果がある場合
    if result:
        # ポイント名ごとに分類
        campaigns_by_point = {}
        for campaign in result:
            point_name = campaign[0]
            if point_name not in campaigns_by_point:
                campaigns_by_point[point_name] = []
            campaigns_by_point[point_name].append(campaign)

        # メッセージを整形
        formatted_results = []
        for point_name, campaigns in campaigns_by_point.items():

            #formatted_results.append(f"\n- {point_name}-")
            formatted_results.extend(
                [f"\n\n{campaign[1]}({point_name})』\n{campaign[2]}" for campaign in campaigns]
            )

        return f"おっ、『{keyword}』に関連するキャンペーンを探しておるのか?\n\nふむふむ……おおっ、こんなのが見つかったぞい!これは見逃せんぞい!" + "\n".join(formatted_results)
    else:
        return f"""……ん?残念ながらその名前ではキャンペーン情報は見つからんのう。ワシはポイントサイトや色んな会社の公式情報を参考にしておる。\n\n融通が利かなくて申し訳ないのじゃが正式名称じゃないとワシは認識できないのじゃ。ひらカナを変えたり、他のやり方で試せば出せるかもしれん。\n
ちなみに、自治体商品券を探すなら、末尾に『市・区・町・村』をつけてくれると助かるぞい。ワシも頑張って探してみるから、また声をかけてくれのう!"""

かいつまんでコードを説明しましたが、全コードは下記に入ってます。

2
0
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?