前回やったこと
簡素な改修
このままだと、ほしいページ配下のデータしか取得できない。
ほしいページを配列に入れてループしよう
少し作り変える
改修前
pageName = "kasa-kurabe"
url = "https://print-kids.net/print/sansuu/" + pageName + "/"
改修後
pageNames = {"ikimono-card","okashi-card","douro-hyoushiki-card","tenki-kion-fukusou","hyoujou-kimochi","hyousyoujou"}
for pageName in pageNames:
url = "https://print-kids.net/print/other/" + pageName + "/"
結果
複数のカテゴリを一挙にスクレイピングできるようになった。
配列に入れる情報もスクレイピングしたらいいじゃんと思ったが、ほしくないデータも大量に受け取るのもてにあまるので、一旦はこれは個人利用の最適解と認識し、プリントスクレイピング改修はほしいラインに届いたことにする。