前回記事(https://qiita.com/tttbbb123/items/ba65e66282d48ead71c0)
で少し触れた「生成AIを用いたWEBスクレイピング」を業務に活用して、
業務効率を上げてみようと考えてみました。
地味に手間で何とかならないかなと思っているのが、
上場小売各社の月次売上速報を拾いまとめること。
弊社としてウォッチしたい各社の情報を拾って
マーケットの全体感や自社との相違点を考えるのが目的。
新聞記事やそういう有償サービスもありますが、
あくまで自社に特化した形として、↑のように毎月初に手作業でコピペしています。
これを自動化できないか?という試みです。
1.chat-GPTに頼る
まず、chat-GPTに既存のエクセル表を読み込ませてみました。
ふむふむ。
まさにその通りのご理解です。
えっ、まとめないといけないの?
まあ初手で同名の違う企業を拾ってしまったり、
間違えたページからデータを拾われても困るので
その程度のことはこちらでまとめてみますよ。
これで良し。
ということでお願いしまーす!
It seems like I can’t do more advanced data analysis right now. Please try again later.
ですって!24時間待てとのこと…。
調べてみるとスクリプトでの指示ではなく、表の読み込みは頭を非常に使うということのようで
無料アカウントではかなり限定的なことしかできないとのこと。
2.Claudeを使う
ということでchat-GPTは断念し、教えていただいたClaudeを使ってみる。
うーん。エクセル表はダメみたい。
結局コピペが手間だから表にまとめて、
一覧でパッと見られる状態を作りたいのは譲れない一線。
ということで早々に断念。
3.Geminiを使ってみる
次は君に決めた!
おおお!ええやん!一部埋まってない所あるけど。
しかもスプレッドシートでダウンロードできるし!
情勢分析もしっかり。自分でもこんな文章書きそう。
細かなところだと㈱しまむらが20日〆の数字であることも
しっかり注釈をつけてくれていて好印象。
でもファストリの数字違うくね?
なんと。
"本日(2025年4月2日)15時30分に弊社HPにて開示いたしました、「国内ユニクロ 3月度月次売上速報」及び「国内ユニクロ出退店情報」につきまして、15時30分から16時40分頃まで、昨年度の情報が掲載されておりました"
https://www.fastretailing.com/jp/ir/news/2504021800.html
ファストリともあろう大企業でもこんな凡ミスをするんですね~
ということはさておき、そんな1時間10分しか掲出されていなかったはずの
誤った数字をGeminiくんはどこから拾ってきたのでしょう??
4.結論
やってみて思ったことはIRで掲出される月次売上概況のようなものは、
各社それぞれのフリーフォーマットであり、
情報を集めてくるのは生成AIを用いても得意とは言えないだろう。
結局、必要な情報を認識してお好みのフォーマットを埋めていく…という作業であれば
人間が動いた方が早いかもしれないし、何といっても正確性は担保される。
しかもそれらを収集している間に考えを深められるというオマケつき。
結局生成AIでスクレイピングしてもその正確性を確認するために
一次ソースを確認することになってしまいそう。
(今回のファストリの件がまさにそれ)
この業務に限って言えばせいぜい毎月1回1時間ちょいの話なので、
そのためにchat-GPTの有料垢($22/月)に課金するのも違うような気がする。
で、あれば何の時間削減にも捻出にもならず、
無駄な手間を1つ増やしただけである今回の取り組みは
完全な失敗といって差支えが無いだろう。
ただ、社内の別業務には何らかの形で使えそう…
と思えたことは今回の収穫。
次回に続く(のか?