そもそも筆者(青野)がプライベートで使っている生成AIって何?
下に登場する表に出てくるモデルはおおむね利用したことがありますが、最近までほとんど課金してこなかったので、安価モデル/無料モデルの利用率が高い気がします。
その他の各種生成AIは実はほとんど使ったことがありません。(Claude、Perplexity
、資料作成系、画像・動画生成系、ノートアプリ系)
筆者の使ったことのある生成AIの頻度(体感)、ただしモデルによって用途が違うので目安です。(今のメインはOpenAI-o3、Chat GPT-4o、gemini 2.5 Pro)
GPT-4o mini >> gemini 2.0 flash/Pro ≒ gemini 2.5 Pro > GPT-4o ≒ OpenAI-o3 > OpenAI-o1 ≒ OpenAI-4o >> Llama3.2
最近はOpenAI-o3、gemini 2.5 Proでキャリア相談、各種戦略立案、ノンフィクション小説執筆、家族旅行のプランニング、出先で見た景色や動物の解説、家族の思い出写真のアニメ画像待ち受け化、冷蔵庫写真からのレシピ考案、Streamで立ち上げておいて子供の遊び相手(話相手)になってもらう等の活用をしており、ようやく生成AIが日常生活にすんなり入り込むようになってきたなーと思っています。
一年前はプログラムもそれなりに時間をとって勉強していましたが、今はほとんど勉強できていません。←もうちょっと勉強したいな、と思ってはいます。(当時はCursor + ChatGPT-4o miniがメインでした。最近はお試しレベルでCursor + Github Copilotや、Cursor + Clineは試したことがあります)
GPT-3.5:〇〇〇〇Chat
GPT-4:体感だと割と最近までCopilotはこのレベルに達してなかった(3.5よりちょっと賢いくらい)
GPT-4o:このモデル自体がアップデートを繰り返しているため一概には表現しづらいものの、5/21時点のCopilotは同日のChat GPT-4oと同レベルの回答を生成できるようになっています。(5初旬はGPT-4くらいだったのが急に賢くなった)
GPT-o3:Researcher(Researcherを少ししか使っていないので評価が難しいのですが、挙動はResearcherの方が賢い感じの印象あり。そもそも社内データの食べ方が従来のCopilotとはレベルがまるで違います)
ブランド | モデル名 | 登場時期 | 特徴 | 料金 | 備考 |
---|---|---|---|---|---|
OpenAI | GPT-3.5 | 2022年11月 | 汎用・軽量 | ChatGPT無料/API: €0.47/1M | 廃止済 |
OpenAI | GPT-4 | 2023年3月 | 高精度 | ChatGPT Plus/API: €27.9/1M | ChatGPTで廃止 |
OpenAI | GPT-4o | 2024年5月 | マルチモーダル | 無料(制限あり)/Plus/API: €4.65/1M | 無料ユーザーは制限あり |
OpenAI | GPT-4o mini | 2024年7月 | 軽量 | API: $0.15/1M | 無料ユーザーのデフォルト |
OpenAI | GPT-4.5 | 2025年2月 | 高精度・高コスト | API: $75/1M | API提供終了 |
OpenAI | GPT-4.1 | 2025年4月 | 長文対応 | API: $30〜$50/1000回 | Plus/Team向け |
OpenAI | o1-mini / Pro | 2024年9月〜 | 高速推論 | Pro: $150/1M | Pro限定 |
OpenAI | o3 / o3-mini | 2025年1月〜 | 軽量・高速 | API: $25〜$30/1000回 | o3-miniは無料 |
OpenAI | o4-mini | 2025年4月 | 軽量・視覚対応 | API: $0.15/1M | 無料ユーザーも利用可 |
Gemini | Gemini 1.0 Pro | 2023年12月 | 初代汎用 | 無料/API: $0.15/1M | 廃止 |
Gemini | Gemini 1.5 Pro | 2024年5月 | 長文・マルチモーダル | 無料/API: $0.15/1M | 使用終了予定 |
Gemini | Gemini 1.5 Flash | 2024年5月 | 高速・低レイテンシ | API: $0.15/1M | 現行モデル |
Gemini | Gemini 2.0 Flash | 2025年1月 | 軽量・高速 | API: $0.15/1M | デフォルトモデル |
Gemini | Gemini 2.0 Pro | 2025年2月 | 高精度 | API: $0.15/1M | 無料ユーザー利用可 |
Gemini | Gemini 2.5 Pro | 2025年3月 | 最先端推論 | API: $0.15/1M | 無料ユーザー利用可 |
Researherのざっくり線表
- 4末あたりからMicrosoftの中の人(ここでは畠山さん、西脇さん)が**「これはやばい」とResearcherを大絶賛**
- 5/16辺りから日系企業でちらほらResearcherの使用例の投稿あり
- 以下に示す事例集は、上記すべてについて5/21 0時時点でまとめたものです
- おおむねソースはXのポストですが、名古屋LLMでの講演内容と懇親会での会話を記憶を頼りに記載してます
おゆ
みかん
TAICHI
Kaz Asada
Ota Hirofumi
A2C@オルターブース
西脇資哲
Daiyu Hatakeyama
名古屋LLMの資料(記録したもののみ)
以下、記憶にある限りのプレゼン内容 & 懇親会で聞いた話
-
とにかくメモをとってチームで情報共有するのが大事(このプレゼンでの一番言いたいことだと思います)!!
-
MSの製品はその思想通りに使う!!(注:アンチパターン:なんでもパワポ(トヨタのA3 1枚サマリ文化)、非構造化エクセル)
(注:Amazonのワードでまとめる文化がデザインパターン。実際生成AIにとってのコミュニケーションコストは段違いです) -
Teamsチャット、Loopなどモダンアプリを活用!!(生成AIとの相性〇)
-
データの階層を気にする必要はない、とにかくSPOにアップロード!!データのグラフ化のモデルは従来から変更していないものの、出力モデルの圧倒的進化によってすべてを解決する。
-
推論モデルは一度考えると30分考え続けたり、考えた結果エラー出力となる場合がある。複数タブで同時にABテストするなどしてカンコツを貯めているところ。
-
推論モデルを使う上ではシンプルなプロンプトとする方がいい傾向にあると思われる(注:この辺りはOpneAI oXでも言われていることです)。
コツが3つほどあるので、近日公開予定(おそらくgithub上)。 -
初心者は気になることを素朴に一文入力してみるのがいい。それ以上でも以下でもない。詳しい人は従来のプロンプトとは全く考え方が違うので、その辺のノウハウを今畠山さん自身検証中。
-
人事考査のレポート作成がかなり時間のかかる作業だったが、Researcherが使えるようになったおかげで、かなり作業が楽になった
-
Teams会議の要約の展開は不要。文字起こしさえされていれば、気になったときにResearcherに聞けばよい。(実際の畠山さんのスケジュールを見せてもらい)これだけ会議がバッティングしていたり、深夜の会議がたくさん入っているが、前述の運用で全く問題ない。Researcherで働き方が変わる。
(注:(直接聞いたわけではありませんが)スケジュールやタスクを整理するようなプロンプトを定期的に実行している、ようなイメージだと思います) -
ファイル形式としては、Wordのようなテキストデータ > 図形を含むPPT ≒ テーブル化されたExcel >>> 適当に作られた非構造化エクセル の順に親和性が高い。Excelに張り付けられたスクショなどは最悪。(注:将来的にはどうなるんでしょうか。。個人的には少なくともここ数年は基本的なお作法を守った方が、人間⇔生成AI間の余計なコミュニケーションコストをかけずに済むので無難だと思います)
PPTは意外とちゃんと読み取ってくれる。Excelはものによる。
Daiyu Hatakeyama
もくだいさん
りなたむ