データ収集の悩みを一気に解決！Bright Dataの次世代Webスクレイピングにチャレンジ

Claude Code × Bright Data MCPで始めるデータ収集自動化

Posted at 2026-02-13

はじめに

業務で「一次情報（公式ドキュメント）をまとめて取りたい」「LLMに複数URLをまとめて読ませたい」という場面ありませんか？

コーディングであればContext7があれば大体解決します。ビジネスサイドの業務の場合はChatGPTやGeminiのDeep ReseachやManusのWide Searchで対応できます。

ただ一方で一部ソースの情報は入手できませんし、アクセスがブロックされることもあります。

そこで役に立つツールの一つがBright Dataです。Bright Dataはプロキシ基盤やスクレイピングAPIを提供するプラットフォームです。LLMから使いやすい形としてMCP（Model Context Protocol）サーバーも用意されています。

本記事では、Bright Dataの説明とBright Dataを入門するための方法の一つとしてClaude Code × Bright Data MCPの利用方法を説明します。

スクレイピングを実施する際は、対象サイトの利用規約・robots.txt等を十分に確認してからご利用ください。

Bright Dataとは

Bright Dataは一言でいうと、Webデータ収集のためのインフラとAPIをまとめて提供するプラットフォームです。

情報収集自動化に関しては、以下のような課題があります。

Bright Dataは上記の課題を解決できるツールであり、後続で説明するMCP Serverの利用が可能です。

Bright Dataは大きく分けると次のレイヤーがあります。

1) プロキシ基盤（Proxy Infrastructure）

Bright Dataは 150M+規模のIPネットワークを掲げ、用途に応じてResidential / Datacenter / ISP / Mobile などが使えます。
自前でプロキシ調達・ローテーション管理・セッション管理をしなくても、プロダクトとしてまとめて扱えるのが強みです。

2) WebアクセスAPI

代表例がUnlocker API（Web Unlocker）です。
Unlocker APIは、リクエストの裏側でプロキシ選定・ヘッダ/フィンガープリントの調整・CAPTCHA対応・リトライなどを自動化可能です。

3) LLM向けのプロトコル（Bright Data MCP / Web MCP）

Bright Dataは MCPサーバー（Web MCP）を提供していて、LLMツール（Claude Codeなど）から「検索→ページ取得→抽出」をツールとして呼べるようにしています。

セキュリティとコンプライアンス

公式サイトによると、以下の観点からBright Dataはセキュリティとコンプライアンス的な部分も遵守しているそうです。

こちら筆者は試せてはいないのですが、デフォルトではrobots.txtで禁止されている領域へのアクセスは自動的にブロックされるようです。

念の為にはなりますが、ご自身でも対象サイトの確認をすることを推奨します。

Bright Data MCP（Web MCP）とは

Bright Data MCPは、例えば次のようなツールが使えます(一部)。

検索：search_engine / search_engine_batch
取得（スクレイピング）：scrape_as_markdown / scrape_as_html / scrape_as_text / scrape_batch
抽出（整形）：extract
統計：session_stats
ブラウザ操作の自動化：browser_navigate、browser_click、browser_screenshot など
特定ドメインの構造化データ取得：web_data_* 系（例：EC・SNSなど）

これにより、多くのWebサイトから情報を取得可能です。

Bright Dataの使い方

以下の使い方としておすすめです。

Claude Code × Bright Data MCPで、検索→一次情報→要点抽出(無料枠で実施可能)
必要に応じてブラウザ操作自動化/構造化データを足す
定常運用を実行する場合は Python（Unlocker API / SDK）等のスクリプトに変換

以下、Claude Codeでの導入から具体例までまとめます。

前提：Bright DataのAPIトークンを用意

Bright Data側でアカウント作成＆APIキー（トークン）を用意します。無料枠の案内もドキュメントにあります。

Claude Code上でのセットアップ

以下コマンドでセットアップできます。

$ claude mcp add --transport http brightdata "https://mcp.brightdata.com/mcp?token=YOUR_API_TOKEN"

.mcp.jsonに以下のように記述してもセットアップ可能です。
必要なツールが課金プランにしかない場合は、課金しつつPRO_MODEをtrueにしてください。

{
  "mcpServers": {
    "brightdata": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "${BRIGHTDATA_TOKEN}",
        "PRO_MODE": "false"
      }
    }
  }
}

使い方例

例えばClaude Code上で以下のようなプロンプトを打つと情報を取得できます。

Bright Data MCPを使って「Unlocker APIの特徴」を調べて。手順は以下。
1. search_engineで公式ドキュメントを探す
2. 上位3ページをscrape_as_markdownで取得
3. 重複を除いて要点を箇条書き
4. 参照URLも付けて

また複数のリサーチを実施したい場合は以下のように使うと良いでしょう。

次のURLリストをscrape_batch_as_markdownで取得して、
各ページの「特徴」「料金」「制限」を抜き出して比較して。

{URLのリスト}

複数情報の取得はClaude Codeだとサブエージェントを使うなどでも解決できますが、バッチの処理を外部で実施してくれるのは便利です。

スクリプト化

Claude Codeで安定的に利用できるかつ定期的な情報の取得が必要であればスクリプト化してGitHub Actionsやcronなどで定期実行するのは良いでしょう。

例えば以下のようなプロンプトを実行すればスクリプトが作成できます。

現在まで行ったBright Data MCPを使った情報収集をスクリプト化したい。

brightdata-sdkを用いてPythonで実装してください。

ドキュメントは以下です。

https://docs.brightdata.com/api-reference/SDK

おわりに

本記事ではBright Data及びBright Dataの入門としてClaude Code × Bright Data MCPの使い方を説明しました。

冒頭で述べましたが、以下に注意して適切な情報収集を心がけてください。

スクレイピングを実施する際は、対象サイトの利用規約・robots.txt等を十分に確認してからご利用ください。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up