はじめに
みなさん、生成AIといわれて何を思い浮かべますか?
有名なものだとChatGPTやDALL-E、CopilotやGeminiと行ったところでしょうか...?
また、ChatGPTと一口に言っても、GPT3.5-TurboやGPT-4、GPT-4oなど様々な選択肢が提示され、何がなんだか...?
ということで、一度GPTとChatGPT/Geminiなどの関係と利用料金、日本語への対応状況を整理しました。
また、私が使用している生成AIについてもまとめておきますので、参考にしてください。
GPTとは
GPTといわれると、パーティショニングの「GUID Partition Table」が先に出てくる人も多いのでは...?
(特にArchやGentooインストールしたことある人は)
...という茶番は置いといて、GPTは「Generative Pre-trained Transformer」の略であり、これはAIで使われる「大規模言語モデル」(LLM:Large language Model)の一つと言えます。
これ以上深掘りすると一気に難しくなるのでこの程度にしておいて、GPTの種類を見ていきましょう。
GPT-3.5とGPT-4の違い
項目 | GPT-3.5 | GPT-4 |
---|---|---|
プロンプトで使えるもの | テキストのみ | 画像や文書ファイルも可 |
音声入出力 | 不可 | 可 |
上記の通り、GPT-3.5ではテキスト入出力にしか対応していませんでしたが、GPT-4では画像や音声を扱えるようになっています。
最近、Windowsのライセンス認証のためにMicrosoftに電話しましたが、自動応答メッセージでしたが、インストールIDは手打ちではなく読み上げるだけでライセンス認証を通せました。このようなところにGPT-4が使われているのかなーと思いました。
GPT-4とGPT-4 Turbo、GPT-4oの違い
GPT-4o: 「ジーピーティー4オムニ」と読みます。GPT-4oの「o」は厳密にはアルファベットではなくギリシャ文字のようです。
リリース順はGPT-4->GPT-4 Turbo->GPT-4oで、性能はGPT-4o>GPT-4 Turbo>GPT-4であることしかわかりませんでした...
試しに、GPT-4とGPT-4 Turbo、GPT-4oに同じプロンプトを与えてみましょう。
ここから、GPT-4とGPT-4 Turboのリリースの間で少々時間が空いていることがわかります。
また、新しくなるほどナンバリングや箇条書き、見出しなどで読みやすくなっていることもわかります。
AIアシスタント
今使えるAIのアシスタントは以下のようなものがあります。
ChatGPT
説明不要だと思いますが、GPTの開発元である「OpenAI」謹製のアシスタントです。
Microsoft Copilot
Microsoft Edgeに統合されたAIです。情報のソースも提示してくれます。
Windows Copilot
Windowsに統合されたAIです。Edge版に加えて画面のキャプチャをかんたんに貼り付けられます。
GitHub Copilot
コーディングに最適化されたAIです。日本語非対応?
Google Gemini
AndroidではGoogleアシスタントとの置き換えも可能。日本語非対応。
[番外編] PortalAI for OMU
公立大学法人大阪傘下の学校(大阪公立大学・大阪府立大学・大阪市立大学・大阪公立大学工業高等専門学校)に属する学生・教職員が利用可能
GPT-3.5 Turbo/GPT-4/GPT-4 Turbo/GPT-4oが利用可能だが、画像やファイルを添付することはできない。
私のAI活用法
- 少し気になることがあればとりあえずWindows Copilotに聞いてみる→提示されたリンクをたどってみる
- 作成した文書を添削してもらうときはChatGPTでGPT-4oを使う
- PortalAIで問題を生成し、演習をする
- コーディングでは基本的にGitHub Copilotを有効にしておき、自分で提示されたコードよりもいいコードをかけるように意識しつつ無理だと思ったらそれを使う
おわりに
Windows CopilotによってAIは利用しやすくなっていると思います。
しかし、私はWindowsを消し飛ばしてLinuxに乗り換えた人なので、何らかのAIアシスタントをキーバインドだけで起動させれるようにしたいと思います。