こんにちは!逆瀬川 ( https://x.com/gyakuse ) です!
このアドベントカレンダーでは生成AIのアプリケーションを実際に作り、どのように作ればいいのか、ということをわかりやすく書いていければと思います。アプリケーションだけではなく、プロダクト開発に必要なモデルの調査方法、training方法、基礎知識等にも触れていければと思います。
今回作ったもの:
0. 今回の記事について
以前、27分でかんたんなチャットアプリを作り、記事も執筆して公開するというデモをやりました。今日はOpenAIから発表されたo1 Proを用いてアプリケーションの企画・開発をやっていきたいと思います。今回の記事の目的は「このレベルだったらほとんど自動的にできる」というのを明らかにすることです。もちろん各段階での能力はまだ未熟ですが、ちゃんとしたプロダクトが100点としたら20点くらいは取れると思うので、1時間くらいでぱぱっと作らなきゃみたいなときにはいいかもしれません。
想定する読者
- ChatGPT Pro に入るか悩んでいるかたがた
1. アイデアを検討する
まずはじめにアイデアありきです。これも o1
で検討してもらいます。
アプローチについて
アイデアの考案のさせ方はいくつか考えられますが、一旦パッと思いつくのは以下です。
-
シンプルに考えさせるパターン
-
AIベンチャーで新規事業を模索しています。アイデアを50個くらい考えて下さい
-
AI系の事業を探索的に検討して下さい。fine-tuningせずに既存のAPIや事前学習済みモデルを使います。
-
既存のビジネスを網羅的にリストアップし、それらのビジネスの抱える課題を解決する AI SaaS を考案して下さい
-
-
ペルソナをもとに考えさせるパターン
-
20人程度の様々な業種・職種の社長のペルソナを考え、インタビュー形式で労働にまつわる課題やペインを聞いてください。ペルソナはよく作り込んでください。
で考案させたあとに彼らの課題を解決するようなAI SaaSについてそれぞれ考えてみて下さい。
で検討させる - 嬉しさ: 課題がペルソナ・ストーリーとセットなのでより深い探索ができる (かも)
- https://chatgpt.com/share/67558860-acec-800d-83df-05ff134a0959
-
-
もうちょっと情報を与えるパターン
AIベンチャーで新規事業を模索しています。アイデアを10個程度考えて下さい。 - すでにあるSaaSに対してAIを使うことで有利なポジションを容易に築けるもの - 使用できるAIは以下 - AI部分はAPIで利用し、AIに関する技術的競争力はゼロであるため、アイデアで優位に立ちたい - 発想の転換をうまくして、潜在的あるいは顕在的な需要に答えるようなソリューションを考えて下さい。 使用できるAI: - gpt-4o: テキスト、音声、画像、PDF、動画等を入力とし、テキスト生成をするモデル。非常に推論能力思考能力音声理解能力画像認識能力等が高い。json_modeに対応し、情報抽出能力も高い - Speech-to-Text API: 音声を正確にテキストに変換 - Text-to-Speech API: テキストを自然な音声に変換 - Translation API: 高速で動的な機械翻訳 - Vision API: 画像のラベル付け、顔とランドマークの検出、光学式文字認識(OCR)、露骨な表現を含むコンテンツのタグ付けなどの画像検出 - Video Intelligence API: 動画レベル、ショットレベル、フレームレベルで豊富なメタデータを抽出 - Document AI API: OCR や Form Parser のような基本的なエクストラクタなどのドキュメント処理
今回使うもの
最後のプロンプトで生成したこちらの議事録系のソリューションを作っていきます
2. リモート会議の内容から自動提案を生成するCRMエンリッチャー (例: Salesforce連携)
概要: 会議ツール(ZoomやGoogle Meet)録画をSpeech-to-Textで自動文字起こしし、顧客応対情報をSalesforceなどのCRMに自動で登録。gpt-4oで顧客のペインポイント抽出、営業フォローアップメール下書き、次回打ち手提案などを自動生成。
競合優位性: 営業担当が後処理に費やす時間を大幅削減、顧客理解が深まり営業効率がアップ。
現在のアイデア検討能力の評価
プロダクトのアイデア検討は現在のLLMではまだ難しい問題です。
良いプロダクトは革新性を誘発するようなうまいプロンプトを作り込む必要があり、そもそもマーケットインなアプローチをちゃんとやろうとすると市場調査やヒアリングに時間をかける必要があります。
ピッチ資料の作成
それでは次にこのアイデアをもとにしたピッチ用プレゼン資料を作っていきたいと思います。o1にプレゼン資料を作成させるとき、いくつかの選択肢があります。
アプローチについて
- Marpベースで作成してもらう
- HTML + JavaScript (Reveal.js) で作成してもらう
- svgで1枚ずつ描画してもらう
作ったもの
簡易仕様の作成とアプリケーションの実装
それでは、使用を考えアプリケーションを実装してもらいます。
以下に実装時のすべてのチャット履歴が見られます。
できたデザインがこちらです。
お世辞にもいいとは言えません。
デザインの改善
ここからデザインをよくしていきます。
以下でチャット履歴が見られます。
できたのがこちらです。
以下では実際の使用例を動画で見ることができます。
gpt-4oでもできていましたが、o1 Proは安定性が増したと感じます。
まとめ
- 本当に単純なアプリならアイデア出し〜実装完了まで30分くらいで作れる世界になりました
- ただ作り込む部分はまだコストが非常にかかるので、これからもわれわれのつらみはしばらく続くでしょう