AIがブラウザを自動操作!無料で簡単にスクレイピングや繰り返し作業ができる「Mastra-CRS-MCP」を試そう!
超抜粋版のセットアップを動画で説明してます。
初心者でも使えますよ!
https://www.youtube.com/watch?v=d2xQXx_TNm4
「Webサイトからの情報収集」「定型的なブラウザ操作の自動化」って、結構面倒ですよね?
PythonやPlaywrightを触ったことはあるけど、セットアップや実装はちょっと大変... と感じている方も多いのではないでしょうか。
そんなあなたに朗報です!
AI(LLM)があなたの指示を理解して、代わりにブラウザを操作してくれるツール「Mastra-CRS-MCP」を開発しました。
無料で簡単に試せるので、ぜひ一度体験してみてください!
Mastra-CRS-MCP とは?
Mastra-CRS-MCP は、以下の技術を組み合わせた、ローカルで動くブラウザ自動操作システムです。
- CRS (Chrome Record Scraper): Chrome ブラウザの操作を記録し、Playwright で実行可能なスクリプトを生成・実行するクローズドソースのツール群 (.exe ファイル)。Web スクレイピングや定型作業自動化の核となります。
- MCP (Model Context Protocol): AI が外部ツールと連携するための共通プロトコル。CRS ツール群を AI から呼び出し可能にする役割を担います。
- Mastra: LLM アプリケーション開発フレームワーク。ユーザーの指示を受け、MCP を通じて CRS ツールを呼び出す AI エージェントを構築します。
これにより、「〇〇のサイトで△△を調べて」「このページから□□の情報を全部取ってきて」といった自然言語での指示で、ブラウザを自動的に操作させることが可能になります。
こんな方にオススメ!
- 無料でブラウザ自動操作やスクレイピングを試してみたい方(月100回まで無料枠があります!)
- プログラミングなしでブラウザの定型作業を自動化したい方
- AI エージェントを使ったツール連携に興味がある方
- 特定の Web サイトからの情報収集を効率化したい方
- Windows ユーザーの方
特徴
- 無料で始められる! (月100回まで)
- ローカルPCで動作するため、セキュリティリスクが低い情報を扱う場合にも利用しやすい。(ただし、個人情報や機微情報は扱わないでください!)
- AI (Google Gemini) があなたの指示を理解し、ブラウザ操作に変換します。
- 複雑な操作も、ツールで一度記録すれば繰り返し実行できます。
- Windows 10 以上に対応。
どうやって使うの? - 簡単4ステップ!
Mastra-CRS-MCP を使い始めるための最低限のステップは以下の3つです。
詳細は、必ず GitHub リポジトリの README.MD を参照してください。
リポジトリURL: https://github.com/sinzy0925/mastra-crs-mcp
(上記 URL を開くと README.MD が表示されます)
- Node.js のインストール: MCP サーバーと Mastra Agent の実行に必要な Node.js 環境を用意します。
- アプリのダウンロードと展開: 上記 GitHub リポジトリからアプリケーションファイルをダウンロードし、展開します。
- 必須のAPIキー設定(2種類): ブラウザ操作機能(CRS)と LLM 機能(Gemini)を利用するための API キーを取得・設定します。
-
アプリケーションの起動: MCP サーバーと Mastra Agent を起動します。
(3. 4.はそれぞれ、実行ファイル「exe」または「bat」を起動するだけですので、超簡単です!)
以下、README.MD に記載されている、STEP 3 (APIキー設定) および STEP 4 (アプリケーション起動) の概要です。詳細は README.MD を参照してください。
STEP 3: 必須のAPIキー設定(2種類)
本アプリケーションを使うには、2種類のAPIキー設定が必須です。展開したフォルダのルートディレクトリにある以下のファイルを順番に実行してください。
-
01_run_get_crs_api_key.exe
:- 本アプリのブラウザ操作機能を利用するための認証ツールです。ダブルクリックして実行し、画面の指示に従って Google アカウントで認証を行い、CRS API キーを取得・保存してください。
- この認証が完了しないとブラウザ操作機能は一切使えません。
-
02_run_get_gemini_api_key.bat
:- Mastra Agent が Google Gemini を利用するための API キー設定バッチです。ダブルクリックして実行し、画面の指示に従って Google AI Studio で API キーを取得し、コンソールに貼り付けて設定を完了してください。
- この設定が完了しないと Mastra Agent が LLM として Gemini を利用できません。
STEP 4: アプリケーションの起動
2つの API キー設定が完了したら、展開したフォルダのルートディレクトリにある 03_start_servers_and_agent.bat
をダブルクリックして実行します。
このバッチファイルが、MCP サーバー群と Mastra Agent アプリケーション(Web UI モード)をまとめて起動します。各コンポーネントはそれぞれ別のコマンドプロンプトウィンドウで起動したままになります。
起動が完了すると、自動的にブラウザで Mastra Agent の Web UI (http://localhost:4111/
) が開きます。
STEP 5: Mastra Agent との対話
ブラウザで開かれた Mastra Agent の Web UI にアクセスし、テキスト入力欄に LLM への指示を入力してください。
例えば:
- 「google で 日本の首相 を検索して」
- 「pmda で パキシル の情報を詳しく教えて」
- 「建築基準法で階段について調べて、関連条文を全部教えて」
Agent はあなたの指示と利用可能なツール定義(setdir
という名前で管理されています)を基に、適切なブラウザ操作(裏で .exe
ファイルを実行)を行い、結果を返します。
新しい操作手順を作成したい場合
既存の操作手順(setdir
)以外でブラウザを操作させたい場合は、ルートディレクトリにある chrome-recorder.exe
を使用します。
- コマンドプロンプトで
chrome-recorder.exe <記録したいURL>
を実行します。 - 起動したブラウザと Playwright Inspector で操作を記録します。
- 生成されたコードとセレクタを、
crs-mcp-scraper-server\bin\
またはcrs-mcp-law-server\bin\
内の適切なsetdir
フォルダにplaywright_steps_logic.py
とplaywright_steps_param.txt
として保存します。 - 必要に応じて Mastra Agent の Instructions を更新します。
詳細は README.MD の該当セクションを参照してください。
困ったときは?
- まずは GitHub リポジトリの README.MD をよくご確認ください。
- README.MD の「トラブルシューティング」セクションを参照してください。
- それでも解決しない場合や、機能要望などがあれば、以下のメールアドレスにご連絡ください。可能な限りサポートいたします。
sinzyアットマークveryglad.net (アットマークは@に読み替えてください)
たくさんの方に試していただけると嬉しいです!
あなたからのフィードバックもお待ちしております!