0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Mercariの商品画像を使ってファッションカテゴリー分類モデルを作ってみる!_スクレイピング編

Last updated at Posted at 2024-06-16

スクリーンショット 2024-06-16 005122.png

概要

Mercariの商品画像をスクレピングし、ファッションをカテゴリーごとに分類する深層学習モデルを作ります。
ただし、今回はメンズのトップスのみに限定させていただきます。

調査の流れ

  1. スクレイピング
  2. データチェック
  3. モデル作成

1. スクレイピング

スクレイピングの流れは、
商品ごとに写真のURLをスクレイピング→URLから商品の画像をダウンロードというものです。

以下は商品画像のサンプルです。

m97553311374_2.jpg

画像のURLを確認すると
https://static.mercdn.net/item/detail/orig/photos/m97553311374_2.jpg?1718502543でした。

画像のURLはhttps://static.mercdn.net/item/detail/orig/photos/{商品のID}?1718502543という構造であることがわかったので商品IDを取得すればいいことがわかりました。

実際のサイトにて検証するとmerItemThumbnail fluid__a6f874a2のid部分にて商品idが格納されていました。
スクリーンショット 2024-06-16 110728.png

今回はこの部分をサイトからスクレイピングしていきます。

各カテゴリーごとに50ページスクレピングします。
1ページに120商品あるので、1カテゴリーごとに最大で6000枚の写真を取得できる計算になります。

以下がスクレピングした情報で作成されたデータフレームです。
スクリーンショット 2024-06-16 112136.png

カテゴリーごとに何枚写真があるかも集計してみました。

スクリーンショット 2024-06-16 112620.png

どのカテゴリーもだいたい6000枚あることがわかりました。

次回予告

今回の記事は情報の集め方のみ取り扱いました。
次回は取得した画像を各カテゴリーごとに分析し、しっかり画像を取れているかや服の特徴等を調べようと思います。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?