以下にここ3年のAIの流れ、トレンドについてまとめます。
2022年のAI
画像生成技術の台頭
●生成的敵対ネットワーク(GANs)、生成的事前訓練(GPT)などの技術
●Midjourney、StableDifussion
ウェブサイトでテキストを入力するだけで、無料で画像が生成することが可能
生成した画像は基本的には商用・非商用を問わず、自由に利用できるというライセンス
●自然言語処理(NLP)の進化:NLP技術は急速に進化し、より自然な会話型AIや翻訳、要約などの応用増加。
特に、GPT-3.5のような大規模な言語モデルが注目
2023年のAI
CHATGPTモデルの対応
●GPT-4モデルをベースとして登場し、より自然な会話や高度な生成が可能
※ChatGPTは、GPTモデルを基にした会話型AI
※GPT(Generative Pre-trained Transformer)モデルは、
OpenAIによって開発された自然言語処理(NLP)のためのAIモデル
●AIによる医療の進化: AIが診断支援や治療計画の最適化に役立つようになり、
医療分野での応用が広がる
●DALL-E 3が2023年8月登場(OpenAI)
●2023年5月からDALLをCHATGPT、Copilot活用可能
2024年のAI
生成AIの進化
●自動テキスト生成技術のほぼ実用化
無料版でもそれなりにOK
●Copilotの普及
(MicrosoftはOpenAIと協力体制であり、実はCopilotの中で動いているAIはOpenAI製)
[Copilotに比べて、ChatGPTのほうが、エンジンのGPTはグレードが高い。
・下記は有料版の比較
GPT-4TurboはGPT-4Turbo
ChatGPTPlusはGPT-4Turbo・GPT-4o・GPT-4omini
・ExcelやWordなどのOffice製品との連携に関しては、Copilotの方が圧倒的に簡単
画像生成には、どちらもOpenAIのDALL•E3(ダリ・スリー)というAIを利用
入力トークン数に関しては、圧倒的にChatGPTが上であるため、
多くのテキストを読み込ませたい場合はChatGPTを使用する必要あり。
・CHATGPT
無料版、有料版の違いは内部のエンジン、反応速度(優先アクセス)、
入力データ数
無料版CHATGPTは画像生成不可
・COPILOT
無料版、有料版の違いは内部のエンジン、反応速度(優先アクセス)、
入力データ数、生成画像数、Officeアプリでの利用有無
]
・マルチモーダル技術の向上
AIが複数の異なる種類のデータ(例えば、画像、音声、テキストなど)を
同時に処理・理解する技術のこと
ユーザーが写真をアップロードし、その写真に関連するテキストを入力すると、
その画像とテキストを組み合わせて理解し、適切な情報を提供することができる
また、音声認識と画像認識を組み合わせることで、ユーザーが「この写真の説明を教えて」と
言ったときに、AIは画像を認識し、その説明を提供することができる
・なくならないハルシネーション
デルの特質 そもそもの学習データの質が原因
・生成AIは『過度な期待』のピーク期の下り方向にある。
『想定以上にコストがかかっている』といった幻滅的な事象も発生。
GPUやサーバのコスト、維持管理。冷却水の問題。
LLM(largelanguagemodel)のオープンソース化、小規模化に向かっている事象もあり。
2025年のAI
2025年はAI新規開発の中断や既存AIの流用に向かう可能性もあり。