1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

GPTBotの暴走でサイト停止…サイト運営者は要注意!

Posted at

個人開発で「転職DB」というサイトを運営しているのですが、
ある日突然サイトが落ちて、焦って調べたらGPTBotの大量アクセスが原因でした。

「GPTBotって、OpenAIのクローラー?」
そう思いつつログを見てみると、
DDosさながらの連続アクセスでMicroCMSのHobbyプランのデータ容量上限(20GB)に達し、APIが停止されてしまった感じです。

(実際のユーザーより先にBotに来られても困る…)

何が起こったのか

容量が一瞬で20GBに

以下の画像が、停止したときのMicroCMS管理画面(容量のグラフ)です。
容量の推移が異常に跳ね上がっていて、ほぼ瞬間的に20GBを超えました。

スクリーンショット 2025-01-31 23.44.50のコピー.png

GPTBotのアクセスログ

さらにサーバーのログを見ると、
存在しないページにも連続リクエストが飛んできていて、
とにかく挙動が謎すぎる状態に。

スクリーンショット 2025-02-01 0.08.09のコピー.png
スクリーンショット 2025-01-31 23.45.39のコピー.png

普通のクローラーは、

  • robots.txtを一応見てくれる
  • サイトマップを辿る
    など一定のルールでアクセスしてくるものですが、
    GPTBotは(現時点では)まるでDDosのようにやってくる印象でした。

対策:robots.txtでブロック

当面、最も手っ取り早い方法はrobots.txtでブロックすることです。
以下を追加するだけで、少なくとも「ブロックしますよ」と明示できるのでおすすめです。

robots.txt
User-agent: GPTBot
Disallow: /*

MicroCMSのHobbyプランのように転送量に上限がある場合は特に要注意です。

宣伝: 転職DB

転職DBは個人ブログやnote、Wantedlyなどに散在する転職体験談を要約・検索して閲覧できるプラットフォームです。

スクリーンショット 2025-01-30 22.45.40.png

企業ごとの退職者、転職者の評価や転職理由などキャリアを考える上で参考になる情報が集まっています。
興味のある方は、ぜひサイトを検索してみてください。
スクリーンショット 2025-01-29 23.11.34.png

転職DB

まとめ

  1. GPTBotが大量アクセス → MicroCMSの転送量20GB超え → API停止
  2. 存在しないページへのリクエストも多く、挙動が謎
  3. robots.txtでブロックするのが一番手っ取り早い対策

個人開発に限らず、小規模のサイトでも似たようなことが起きる可能性は十分あると思います。
「突然サイトが落ちて原因がわからない」という方は、
ぜひ一度GPTBotのアクセスを疑ってみてください。

筆者のX

筆者は主にWeb開発・個人サービス運営系の話題をつぶやいています。
よろしければフォローよろしくお願いします!
bani24884

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?