はじめに
前回の記事投稿から早1年、その間に、ChatGPTというツールが登場し、
自分のような一般人でも普通にAIに触れられるようになりました。
2023年現在も「GPT-4 Turbo」(有料版)が公開され、さらに活用範囲が広まったもよう。
今更ですが…
GPT-3で、簡単な質疑応答くらいしか活用していなかった自分。
ChatGPTがプログラミングは得意分野だと知ってはいたものの
なかなか触るきっかけがありませんでした。
今回はその機能を体験してみるべく
「ChatGPTと会話して、WEB自動操作ツールを作成する」
ということをやってみました。
無料版の備忘録です。すでに活用されている方には基礎的な内容になりますので、ご了承ください。
作成したもの
コードを実行すると、ブラウザを起動してgoogle検索します。
意外に時間がかかってしまった…
「チャット開始から、動くまで数分でできた!」
…となると思っていたのですが
・ピンポイントで質問ができなかったこと(Pythonにそこまで詳しくない)
・ChatGPTを使い慣れていないこと(特にプロンプトの入れ方)
これらが原因で、エラー解決に時間がかかり、
この程度のツールに完成まで半日くらいかかってしまいました。
それでも、ゼロベースよりは断然早く完成し、
ChatGPTのすごさ、便利さはしっかり実感できました。
手順
0.前提条件
ChatGPTが利用できること(GPT3.5)
Pythonが実行できること
⇒以下のコマンドで確認できます
python --version
1.GPTに、作りたいものを丸投げしてみる
こんな書き方ではダメかな?と思ったのですが…
とりあえず作りたいものをプロンプトに記入してみました。すると、
一瞬で、元になるコード(解説付き)が。
必要なライブラリ、ドライバのインストール方法まで。
実際に使ってみると、本当にすごい。
GPTの解説とコード
ブラウザを操作するためにPythonを使用する場合、Seleniumというツールが一般的に利用されています。Seleniumは、ブラウザを制御してウェブページ上での操作を自動化するための強力なツールです。以下に、Seleniumを使用してブラウザを操作するための基本的なPythonプログラムの例を示します。
まず、Seleniumをインストールします。以下のコマンドを使用してインストールできます。
bash
Copy code
pip install selenium
次に、以下はGoogle Chromeを使用する場合の例です。まず、ChromeDriverをダウンロードして、PATHに追加します。ChromeDriverは、Google Chromeを制御するためのSeleniumのドライバです。ChromeDriverのダウンロードは、https://sites.google.com/chromium.org/driver/ から行えます。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
# ChromeDriverのパスを指定
chrome_driver_path = '/path/to/chromedriver'
# ブラウザを起動
driver = webdriver.Chrome(executable_path=chrome_driver_path)
# Googleのトップページを開く
driver.get("https://www.google.com")
# 検索ボックスにキーワードを入力して検索
search_box = driver.find_element("name", "q")
search_box.send_keys("Python Selenium")
search_box.send_keys(Keys.RETURN)
# 5秒間待機してからブラウザを閉じる
driver.implicitly_wait(5)
driver.quit()
この後にも、
コードの解説や、注意点まで返答をくれました。(省略)
2.返答のとおり、実装してみる
・以下構成でフォルダを作る
デスクトップ
┗ Python
┗ Driver
┗ chromedriver.exe
┗ LICENSE.chromedriver
┗ web.py ⇒・ここにコードを記入する
・chromeDriverのパスを「driver/driver.exe」に修正
chrome_driver_path = 'driver/chromedriver.exe'
・pythonフォルダでCMDを開き、「web.py」を実行する
C:\Users\ユーザー名\Desktop\python > python web.py
これでもう、いきなり完成かと思いましたが、
エラーが出て動きませんでした。
selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 114
Current browser version is 119.0.6045.160 with binary path C:\Program Files (x86)\Google\Chrome\Application\chrome.exe
3.エラーを読む
どうやらドライバーのバージョンが合っていないのが原因のよう。
自分のは「119」で、ドライバーが「114」だと言っているので、
再度、公式サイトからダウンロードしました。
最新版に入れ替え、もう一度実行してみますが、
File "C:\Users\Desktop\python\web.py", line 11, in <module>
driver = webdriver.Chrome(executable_path=chrome_driver_path)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: WebDriver.__init__() got an unexpected keyword argument 'executable_path'
う、またエラー…
4.エラーについて聞いてみる
今度は、エラー箇所とエラーコードをそのまま、対話形式で丸投げしてみました。
最初の質問と同じく、こんな書き方で大丈夫かな、と思いましたが、
すぐに修正コードと、その解説が。
先の会話を踏まえて、回答をくれています。
Seleniumのバージョンの違いによるもので、
そのバージョンにあった書き方をすればよいとのこと。
# ChromeOptionsを作成してドライバーのパスを指定
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument(f'--webdriver.chrome.driver={chrome_driver_path}')
この部分を修正して、動きました!
最後に、sleepで表示速度の調整して、完成。
最終的なコードはこちらです
# ブラウザを立ち上げて、フォーム入力した結果を取得する
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
# ChromeDriverのパスを指定
#chrome_driver_path = '/path/to/chromedriver'
chrome_driver_path = 'driver/chromedriver.exe'
# ChromeOptionsを作成してドライバーのパスを指定
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument(f'--webdriver.chrome.driver={chrome_driver_path}')
# Chromeのウィンドウを開く
#driver = webdriver.Chrome(executable_path=chrome_driver_path)
driver = webdriver.Chrome(options=chrome_options)
# Googleのトップページを開く
driver.get("https://www.google.com")
# 検索ボックスにキーワードを入力して検索
search_box = driver.find_element("name", "q")
search_box.send_keys("Python Selenium")
search_box.send_keys(Keys.RETURN)
# 10秒間待機してからブラウザを閉じる
time.sleep(10)
driver.quit()
print("end")
いつもの癖で、ついgoogle検索してしまいましたが...
1つ目のエラー(ドライバーのバージョン違い)を、つい検索して解決してしまいましたが、
後で「エラーメッセージそのままをGPTに投げればよかったのではないか?」と思い試したところ、バージョン指定するコーディングを教えてくれました。こっちの方が早かったかも。
# ChromeDriverのバージョンを指定
chrome_options.add_argument('--version=119.0.6045.160')
まとめ、感想
質問のやり方が悪く、思いのほか時間がかかってしまいましたが
返答の精度、内容が想像以上でした。
特に便利だった点
とりあえず最初の雛形を作ってくれる
そこからカスタマイズすれば良いので、完成までのハードルがとても下がります。
例えばCSSでも、HTMLを丸投げしたら、いい感じにたたき台を作ってくれました。
質問したことを踏まえて回答(解説付き)をくれる
内容が正しくないこともあるのは注意はいえ、
基礎的な事はかなり効率よく勉強できると思いました。
また、話し言葉でとりあえず投げても内容を読み取って返答してくれるので
(もちろん、GPTが理解しやすいように書く方がより良いのですが)
アイディアや方針の候補探しにも便利そう。
使う側に必要と思うこと
プログラムの基礎知識
何も考えずでコピペして作るだけでは考慮不足な部分があるので、
(例えば、今回のコードだとChromeDriverのバージョンが変わるたびに修正しないといけない)本当にその書き方でよいのか判断したり、もっとこうしたい、をピンポイントで質問するのに、知識は必要だと思いました。
GPTにすべて任せるのではなく、補完してくれる存在なのだと感じました。
明確に伝える能力、文章力
やりたいことを具体的に伝えられると、GPTからの返答も正確になります。
プロンプトのフォーマットなるものもあるらしいので、
今後質問する時は参考にしたいと思います。
・例 やりたいこと+手順を箇条書きにする
一度に指示せず、少しずつ修正して完成させる
おわりに
今更の使い方ではありましたが、こんな便利なものが、誰でも無料で使えるとはすごい時代だなと思いました。
有料版の活用、他ツールと組合わせて出来る事などが多く公開されていますが、とりあえず無料版のGPT3でも自分には充分便利で、対話しながらコードが書けるというのが不思議な感覚でした。
まだ使っていない方、一度試してみてはいかがでしょうか。
最後まで読んでいただき、ありがとうございました。