More than 1 year has passed since last update.

ゴルゴ１３のISBNリストを取得する

Posted at 2022-06-29

概要

くだらない話ですが、所有するコミックのデータベースを作ろうとしてます。
ゴルゴ１３は、２００冊を超える状況で、「さいとう・たかを」先生が逝去された後も、まだ続いています。

そんなゴルゴ１３ですが、ISBNが採用された時期よりも前から出版されているので、ISBNリストを使った書籍情報の検索をしようとしてもISBNが書籍にのっていません。
が、、、、版数が版数なので、ISBNが始まった時期より後に増刷となった場合、古い書籍もISBNが採番されます。

そこで、リイド社のゴルゴ１３のページから２００冊を超えるゴルゴ１３のISBNを取得しようとしてます。
（２００冊を超えるISBNのリストがあれば、そこから持っている巻数のISBNを把握すればいい）

リイド社を見てみる

ゴルゴ１３にもシリーズがあるので、所有しているシリーズを選択してみます。

なるほど、、、、
ざっくり中を見ると、普通に取り出せそうだ・・・

スクレイピングしてみた

リイド社さん、私個人の目的でソース見てごめんなさい。

golgo13.py

import requests
from bs4 import BeautifulSoup
import os

if __name__ == '__main__':
    BASE_URL = "https://www.leed.co.jp/"
    FILE_NAME = "golgo13_isbn.csv"

    currentPath = os.path.dirname(os.path.abspath(__file__))
    filePath = os.path.join(currentPath, FILE_NAME)

    for page in range(10):
        param = {
            "paged": str(page + 1),
            "cond":"series",
            "s": "ゴルゴ１３"
        }

        with open(filePath, "a") as f:
            response = requests.get(BASE_URL, param)
            soup = BeautifulSoup(response.text, "html.parser")
            
            if len(soup.find_all("span", class_='search-book-title')) > 0:
                for item in soup.find_all("span", class_='search-book-title'):
                    title = item.text
                    isbn13url = item.find("a").attrs['href']
                    isbn13 = isbn13url.replace("https://www.leed.co.jp/", "")
                    f.writelines(isbn13 + ", " + title + "\n")
            else:
                break

現在だと、4ページ分の204巻まであります。（スゴイっす）

golgo13_isbn.csv

9784845800018, ゴルゴ１３ （1）
9784845800025, ゴルゴ１３ （2）
9784845800032, ゴルゴ１３ （3）
9784845800049, ゴルゴ１３ （4）
9784845800056, ゴルゴ１３ （5）
9784845800063, ゴルゴ１３ （6）
9784845800070, ゴルゴ１３ （7）
9784845800087, ゴルゴ１３ （8）
9784845800094, ゴルゴ１３ （9）
9784845800100, ゴルゴ１３ （10）
9784845800117, ゴルゴ１３ （11）
9784845800124, ゴルゴ１３ （12）
9784845800131, ゴルゴ１３ （13）
・・・

無事、必要なISBNがゲットできたので、所有コミックのデータベースにISBNをまとめて登録。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up