界隈で話題のツールを使ってみます。簡単に言うと、perplexityをローカル環境で動かすことができます。
ここら辺の記事を参考にさせていただきました。
環境セットアップ
pip install browser-use
pip install langchain
playwright install
コード
python index.py
from browser_use import Agent
from langchain_openai import ChatOpenAI
import asyncio
llm = ChatOpenAI(model='gpt-4o', api_key='xxx')
task='今日の運勢について教えて'
agent = Agent(
task=task,
llm=llm,
)
async def main():
await agent.run()
asyncio.run(main())
APIキーですが、環境変数に設定しようと思ったがうまく動かず、生で入力しました。
※ 本番環境ではやめましょう
結果
playwrightが動き、占い結果をコンソールに出力してくれました。
その他いろいろ
私は毎週、東京都の新型コロナ感染者数をメールで自分に通知しています。やりかたは東京都の感染状況ページをスクレイピングし、感染者数を取得しています。
このような事を書かなくても、browser-useを使えばわかるのでしょうか。
素晴らしいです!
ただ、結果はスクレイピングしたものと変わらないですし、browser-useの方が遅く、LLMのAPI使用料がかかります。取得するソースが特定されている場合、スクレイピングの方がいいですね。
注意点
browser-useもスクレイピングの1種なので、スクレイピングが禁止されているサイトに対して使うことは(技術的に可能でも)規約違反となります。
例えば、以下で挙げられている例は規約違反のものが多いです。