この記事は ゆっくりテックウォッチ Advent Calendar 2025 の 13 日目の記事です。
個人開発の「ゆっくり動画スタジオ」でGitHub人気リポジトリの解説動画を自動生成しており、その分析データをもとに本記事も生成しています。
TL;DR
- 自然言語で指示するだけでAIがブラウザを自動操作
- 求人応募・買い物・情報収集を完全自動化
- OpenAI・Anthropic・Gemini等の主要LLMに対応
このリポジトリについて
AIエージェントがブラウザを自動操作するPythonライブラリです。
LLM(大規模言語モデル)とChrome DevTools Protocolを組み合わせ、AIエージェントが自律的にWebページを操作・タスク実行できるオープンソースライブラリです。求人応募、買い物、情報収集などを自動化可能です。
| 項目 | 内容 |
|---|---|
| リポジトリ | browser-use/browser-use |
| スター数 | ⭐ 73,602 |
| 言語 | Python |
| ライセンス | MIT License |
| 作成日 | 2024-10-31 |
なぜ今注目されているのか
毎日の繰り返し作業、フォーム入力、情報収集に時間を取られていませんか?
自然言語で指示するだけでAIがブラウザを自動操作してくれる時代がやってきました。Browser-Useは、まさにその課題を解決するために開発されたライブラリです。
スター推移
Browser-Useは2024年10月末に公開され、12月下旬に爆発的な成長を見せました。とくに2024年12月25日前後には1日で1,600スター以上を獲得するなど、驚異的な伸びを記録しています。その後も安定して人気を集め、2025年12月現在では7万スターを超えています。全期間で一日あたり平均約180スターのペースで成長しており、AI×ブラウザ自動化分野への関心の高さが伺えます。
主な機能・特徴
1. 自然言語で指示するだけでAIがブラウザを自動操作
まるでAIに話しかけるように、やりたいことを伝えるだけで、AIがWeb上での操作を完遂してくれます。従来のスクレイピングツールのようにセレクターを指定したり、複雑なコードを書く必要はありません。AIが自動でセレクターを判断し、適切な操作を実行します。
2. 求人応募・買い物・情報収集を完全自動化
日常的に行っている定型作業を、このライブラリを使えばAIが代わりにやってくれます。たとえば:
- 求人サイトへの応募フォーム入力
- 競合サービスの価格調査
- オンラインショッピングでの商品検索とカート追加
2時間かかっていた競合サイトの価格調査が10分で完了するなど、劇的な時間短縮が可能です。
3. OpenAI・Anthropic・Gemini等の主要LLMに対応
対応しているLLMは10以上。OpenAI GPT-4、Anthropic Claude、Google Gemini、Ollamaなど、自分の好きなAIモデルを選んで使えます。コストと性能のバランスを考慮して、最適なモデルを選択できる柔軟性があります。
4. 7,500コミット超の活発なオープンソース開発
このプロジェクトは単なる趣味のツールではなく、多くの開発者が参加して日々改善されています。活発なコミュニティがあるため、バグ修正や新機能の追加も迅速に行われています。
技術スタック
Python + LLM + CDP(Chrome DevTools Protocol)で自律型ブラウザエージェントを実現しています。
| 分類 | 技術 |
|---|---|
| 主要技術 | Python 3.11+, asyncio |
| フレームワーク/ライブラリ | pydantic, aiohttp, CDP (Chrome DevTools Protocol) |
| インフラ | Docker, Browser-Use Cloud |
| 連携サービス | MCP (Model Context Protocol), LangChain |
ユースケース
ユースケース1: マーケティング担当者の競合分析
背景: スタートアップで競合分析を担当するAさんは、毎週競合サービス10社の価格とプラン変更を手動でチェックしていました。
課題: 1社あたり15分、合計2時間以上かかる単純作業に時間を取られていました。
解決策: Browser-Useで競合サイトを自動巡回し、価格情報を収集するスクリプトを作成しました。
結果: 2時間の作業が10分に短縮され、空いた時間で分析に集中できるようになりました。
ユースケース2: 就職活動中の大学生
背景: 情報系学部4年生のBさんは、複数の求人サイトに同じ情報を何度も入力していました。
課題: 20社に応募するのに同じフォーム入力を繰り返すストレスがありました。
解決策: Browser-Useで履歴書情報を一括入力し、複数サイトへ自動応募するスクリプトを作成しました。
結果: 1日がかりの作業が1時間に短縮され、エントリー数も増加しました。
ユースケース3: E2Eテストエンジニア
背景: WebサービスのQAを担当するCさんは、Playwrightでテストコードを書いていましたが、仕様変更のたびに修正が大変でした。
課題: セレクター変更で大量のテストが壊れる問題がありました。
解決策: Browser-Useで自然言語テストケースを記述し、AIがセレクターを自動判断する方法に切り替えました。
結果: UI変更時の修正工数が8割減となりました。
競合との比較
Selenium / Playwrightとの違い
| 観点 | Browser-Use | Selenium / Playwright |
|---|---|---|
| 操作方法 | 自然言語プロンプト | プログラミングコード |
| セレクター指定 | AIが自動判断 | 手動で記述 |
| 学習コスト | 低い(プロンプトを書くだけ) | 高い(APIを学習) |
| 実行速度 | LLM呼び出しで遅い場合あり | 高速 |
Browser-Useを選ぶべきケース:
- 非エンジニアでもブラウザ自動化を使いたい場合
- UI変更が頻繁でテストの保守コストを下げたい場合
- 自然言語だけでタスクを指定したい場合
始め方
1. 環境を作成(Python 3.11以上):
uv init
2. Browser-Useパッケージをインストール:
uv add browser-use
uv sync
3. APIキーを設定:
# .env
BROWSER_USE_API_KEY=your-key
4. Chromiumブラウザをインストール:
uvx browser-use install
5. 最初のエージェントを実行:
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def example():
browser = Browser()
llm = ChatBrowserUse()
agent = Agent(
task="Find the number of stars of the browser-use repo",
llm=llm,
browser=browser,
)
history = await agent.run()
return history
if __name__ == "__main__":
history = asyncio.run(example())
詳細は公式ドキュメントを参照してください。
まとめ
Browser-Useは、自然言語でブラウザ操作が可能という革新性、求人応募・買い物など実用的なユースケース、主要LLM対応でコスト・性能を選べる柔軟性を兼ね備えた、AIブラウザ自動化の決定版ライブラリです。
日々のブラウザ作業にうんざりしているなら、ぜひBrowser-Useを試してみてください!
動画でも解説しています
YouTubeチャンネル「ゆっくりテックウォッチ」では、GitHub の注目リポジトリをゆっくり解説しています。
この記事で紹介した browser-use の解説動画も公開していますので、ぜひご覧ください!
チャンネル登録よろしくお願いします!
関連リンク
この記事は AI によって自動生成されました。内容に誤りがある可能性があります。


