はじめに
こんばんは!
最近、プライベートでMacbook proを購入し、遊んでる新人です!
AIエージェントやAI駆動開発の記事がかなり増えています。
自分はまだ未経験エンジニア寄りで、最初からきれいな設計ができたわけではありません。
むしろ最初は「AIに投げればなんとかなるのでは?」くらいの感覚でした。
でも業務向けのAI自動化ツールをいくつか作ってみると、AIそのものよりも、その前後の設計の方がずっと大事だと分かってきました。
作っていたのは、たとえばこういうものです。
-
案件収集・評価・Discord通知ツール
- Gmail、案件ポータル、紹介サイトから案件情報を取得
- Geminiで案件を評価
- 通知済み案件を重複排除してDiscordへ通知
-
外部業務サービス / Gmail同期パイプライン
- 外部サービスやGmailから案件・人材情報を取得
- 共通フォーマットへ正規化してDB保存
- マッチ候補を確認してDiscord通知
-
動画チャプター編集ツール
- 動画をアップロード
- シーン検出、OCR、音声文字起こし
- Geminiで画面内容を解析して章立て補助
-
Cloudflare Workerベースの定期実行ツール
- Cronで外部データを取得
- D1 / R2 / KV に状態を保存
- AI評価後に必要なものだけ通知
どれも見た目は違いますが、作って失敗して直しているうちに、共通点が見えてきました。
この記事では、未経験寄りの自分がAI業務自動化ツールを作りながら、「ここを先に考えておけば後で苦しまなかった」と感じたことをまとめます。
1. AIに渡す前の「入力整形」がほぼ本体
AIを入れると、つい最初にプロンプトを考えたくなります。
自分も最初はプロンプトをこね回していました。
でも実際に効いたのは、プロンプト以前に、AIへ渡す情報をどこまで整えるかでした。
案件評価ツールでは、入力元が複数あります。
| Source | 入口 | 重複判定 |
|---|---|---|
| Gmail通知 | Gmail message ID / 案件ID | message ID / matching ID |
| 案件サイト | 一覧API / 詳細API | matching ID |
| 紹介ポータル | referral project ID | project ID |
| 案件媒体 | matching ID | matching ID |
それぞれHTMLだったり、メール本文だったり、GraphQLのレスポンスだったりします。
このままAIに投げると、毎回入力の形が違いすぎて評価が安定しません。
そこで、まず人間が読みたい形に寄せました。
type ProjectForEvaluation = {
source: "gmail" | "project_portal" | "referral_site" | "media";
sourceId: string;
title: string;
companyName?: string;
budget?: string;
schedule?: string;
description: string;
requirements: string[];
rawUrl?: string;
};
AIに「この情報を判断して」と言う前に、まず全ソースをこの形へ正規化します。
これをやると、プロンプトが短くなります。
以下の案件情報を S/A/B/C で評価してください。
評価理由、懸念点、次に人間が確認すべきことも出してください。
AIに頑張らせるのではなく、AIが迷わない入力にする。
初心者ほどここを飛ばしがちですが、ここが一番効きました。
2. 「全件通知」ではなく「人間が見るべきものだけ通知」する
業務自動化で最初にやりがちなのが、全部DiscordやSlackに流すことです。
自分も最初は「通知されれば便利」と思っていました。
でも全部流すと、すぐ誰も見なくなります。
案件収集ツールでは、最初に複数の入力元から案件を集めます。
- Gmail通知
- 案件ポータル
- 紹介サイト
- 外部サービスの一覧ページ
- 手動で保存したJSON
ここで取れたものを全部通知すると、通知チャンネルがただのログ置き場になります。
なので、通知対象を絞りました。
function shouldNotifyProject(evaluation: ProjectEvaluation) {
if (evaluation.rank === "S") return true;
if (evaluation.rank === "A" && evaluation.needsHumanReview) return true;
if (evaluation.hasUnknownBudget && evaluation.deadlineIsNear) return true;
return false;
}
通知の目的は「処理結果を全部流すこと」ではなく、「人間の次の一手を作ること」です。
これを決めてから、画面もAPIもかなり作りやすくなりました。
- DBには全件保存する
- Discordには人間が反応すべきものだけ流す
- Run logsでは取得件数、スキップ件数、失敗理由を見る
- Raw payloadは後から再解析できるように残す
AIが処理する範囲と、人間が判断する範囲を分けるのが大事でした。
ここを分けないと、未経験の自分でも一見すごいものは作れるのですが、運用するとすぐ通知疲れします。
3. 重複排除はAIより先にやる
AIを使った自動化で地味に大事なのが、重複排除です。
これは作る前はあまり意識していませんでした。
同じ案件が複数経路から入ってくることがあります。
- Gmail通知で来る
- 案件サイトの一覧にも出る
- 詳細ページのURLが違う
- メールIDは違うが案件IDは同じ
- 本文は少し違うが実体は同じ
これをAI評価の後に処理すると、無駄にトークンを使います。
なので、AIに渡す前にできるだけ落とします。
type SourceState = {
source: string;
sourceId: string;
canonicalUrl?: string;
contentHash?: string;
firstSeenAt: string;
lastSeenAt: string;
notifiedAt?: string;
};
重複判定に使ったものは、だいたいこのあたりです。
- Gmail message ID
- 外部サービス側の案件ID
- URLの正規化結果
- 詳細本文のhash
- 既通知のstate
AIは便利ですが、同じものを何度も読ませると普通にお金と時間が溶けます。
「AIで賢く判断する」前に、「そもそも判断しなくていいものを渡さない」方が効きました。
これはAIというより、普通のシステム設計の話でした。作ってから気づきました。
4. Webhookや外部APIは成功前提で作らない
AI連携や外部API連携では、失敗を前提にした設計がかなり重要になります。
最初は成功パターンだけ見て作っていました。
実際に作っていると、こういうことが起きます。
- 外部APIが一時的に落ちる
- HTML構造が変わる
- Discord通知だけ失敗する
- AI評価だけタイムアウトする
- 同じデータが二重に取得される
- 後から同じpayloadを再処理したくなる
なので、処理結果だけでなく、取得元のraw payloadや実行ログを残すようにしました。
type RunLog = {
id: string;
source: string;
status: "running" | "succeeded" | "partial" | "failed";
fetchedCount: number;
skippedDuplicateCount: number;
evaluatedCount: number;
notifiedCount: number;
errorMessage?: string;
startedAt: string;
finishedAt?: string;
};
重要なのは、処理を分けることです。
- 取得
- 正規化
- 重複排除
- AI評価
- 保存
- 通知
このうち通知だけ失敗したなら、取得やAI評価まで失敗扱いにしない。
逆にAI評価が失敗しても、raw payloadが残っていれば後から再実行できます。
地味ですが、ここを作ると運用時の安心感がかなり変わります。
未経験のうちはエラー画面を見るだけで焦りますが、ログがあると「どこまでは成功して、どこで失敗したか」を追えるようになります。
5. AIの設定はコードに埋め込まない
AIの評価基準や出力フォーマットは、運用していると必ず変えたくなります。
たとえば案件評価なら、
- 何を高評価にするか
- 予算を重視するか
- 納期を重視するか
- 既存事業との相性を重視するか
- 通知するrankの閾値を変えるか
- 出力に「次に確認すること」を含めるか
最初はコードにベタ書きでも動きます。
自分も最初はコードに直接書いていました。
でも、少し運用するとすぐ調整したくなります。
なので、AIの評価設定はコードから分離した方が楽でした。
type EvaluationConfig = {
model: string;
rankThreshold: "S" | "A" | "B" | "C";
scoringPolicy: string;
mustCheckFields: string[];
notificationPolicy: string;
};
プロンプトも、役割ごとに分けておくと扱いやすいです。
PromptTemplate
- system
- extraction
- evaluation
- notification_summary
AIの振る舞いは、コードではなく運用設定として変えられる方がいいです。
特に業務自動化は、人間の反応を見ながら改善するものなので、コードデプロイなしで調整できる境界を作った方が楽でした。
ここも、作る前は分かっていませんでした。実際に使ってみて「これ毎回デプロイするの面倒だな」となってから分かりました。
6. Cloudflareに寄せると「運用しない設計」ができる
案件収集や通知のような処理は、ずっとローカルPCやVPSで動かすより、Cloudflare Workersに寄せた方が運用が軽くなりました。
最初はローカルで動けば満足していたのですが、自分のPCが閉じていると動かない時点で業務自動化としては弱いです。
たとえば案件評価ツールでは、Cloudflare Workerを30分おきに実行します。
- Gmail APIからメール確認
- 案件サイトから未処理案件取得
- KVで処理済みstateを確認
- Geminiで評価
- Discord通知
Macが閉じていても動きます。
また、別の同期パイプラインではCloudflare Native構成も検討しました。
VPSにもメリットはあります。
- 既存のDocker/FastAPI/Postgresを移しやすい
- Playwrightなどのブラウザ自動化がやりやすい
- 長時間処理やデバッグの自由度が高い
でも、小さな定期実行パイプラインなら、Cloudflare Nativeの方が運用が軽いです。
- OS更新を見なくていい
- Docker daemonを見なくていい
- ディスク容量を気にしなくていい
- Cron、DB、Object Storage、ログ、デプロイを同じ平台に寄せられる
自分の場合、「最終的に運用したい形」から逆算すると、Cloudflareに寄せる判断はかなり自然でした。
未経験だとインフラを大きく構えがちですが、小さい定期実行なら「運用しなくていい場所」に置く方が続きます。
7. 動画やドキュメント系でも考え方は同じ
動画チャプター編集ツールでは、扱うデータが案件ではなく動画です。
でも、構造はかなり似ています。
- 動画ファイルを受け取る
- シーンを検出する
- フレームを抽出する
- OCRする
- 音声を文字起こしする
- Geminiで画面内容を解析する
- チャプター案として保存する
- 人間が最後に編集する
ここでも、AIに動画全体を丸投げするより、先に素材を分解した方が安定しました。
動画
↓
シーン
↓
代表フレーム
↓
OCR / 音声文字起こし
↓
AIによる章タイトル候補
↓
人間が編集
AIは最後の判断補助に使う。
その前に、AIが見やすい単位へ分解する。
案件評価でも動画解析でも、結局ここは同じでした。
AIに丸投げするほど、出力が当たり外れになります。未経験の自分には、その当たり外れを直す方が大変でした。
8. AIに任せるほど、ガードレールが必要になる
AIを使うと作業は速くなります。
でも、速くなるほど怖い操作も増えます。
特に未経験のうちは、AIが出したコマンドや修正が本当に安全か判断しきれないことがあります。
特にこのあたりは、AIに雑に触らせたくありません。
.env- APIキー
- OAuth token
- Webhook secret
- DB dump
- 顧客データ
- 本番DB
- 本番通知
- main branchへの直接push
なので、プロジェクト側に「AIに見せるもの」と「見せないもの」を分ける必要があります。
自分の運用では、少なくとも次を意識しています。
.env
.env.*
secrets/
backups/
*.dump
*.pem
*.key
data/*token*
さらに、AIには最初に対象範囲を絞って依頼します。
悪い例:
このプロジェクトをいい感じに直して
良い例:
案件評価ツールの重複排除ロジックだけ見てください。
目的は、同じ案件を複数経路から取得しても二重通知しないことです。
本番DB操作、環境変数の表示、外部通知の実送信はしないでください。
変更前に対象ファイルを列挙してください。
AIに全部読ませるより、必要な範囲を指定した方が、精度も安全性も上がりました。
AIが強いほど、こちら側の依頼の雑さも増幅される感じがあります。
作って分かった共通パターン
いくつか作ってみて、AI業務自動化ツールには共通パターンがあると感じました。
最初から分かっていたわけではなく、何個か作ってようやく見えてきた感じです。
外部入力
↓
正規化
↓
重複排除
↓
AI評価 / AI分析 / AI要約
↓
保存
↓
人間が見るべきものだけ通知
↓
ログと再処理
AI部分だけ見ると派手ですが、実際に大事なのはその周辺です。
- 入力を整える
- stateを持つ
- 重複を防ぐ
- 失敗しても追える
- 人間が判断する出口を作る
- 設定を運用で変えられる
ここを作ると、AIはかなり実務に入れやすくなります。
まとめ
AI業務自動化で一番大事なのは、強いモデルを選ぶことだけではありませんでした。
むしろ、未経験寄りの自分が作っていて効いたのは次です。
- AIに渡す前に入力を正規化する
- 全件通知ではなく、人間が見るべきものだけ通知する
- AIに渡す前に重複排除する
- 外部APIは失敗・重複・再処理を前提にする
- PromptやAI設定はコードから分離する
- 定期実行はCloudflare Workersなど運用が軽い場所へ寄せる
- AIに任せる範囲と触らせない範囲を決める
AIを業務に入れるというより、AIが迷わず働ける業務レーンを作る。
まだきれいに作れているとは言えませんが、自分の中では、これが一番しっくりきています。


