有名な生成AIは?と聞かれると、私は真っ先にOpenAIの「ChatGPT」をあげます。
OpenAIといえば12月9日(アメリカ現地時間)動画生成AI「Sora」が一般提供を開始したのが目新しいニュースですね。
OpenAI
2015年に設立され、人工知能(AI)研究と開発を行うアメリカの企業および研究機関です。
自然言語処理(NLP)の分野で革新的な成果を上げており、代表的なプロダクトとして大規模言語モデル「GPTシリーズ」があります。
OpenAIの主なプロダクト
1. GPTシリーズ(テキスト生成AI)
2. ChatGPT(テキスト生成AI)
3. DALL·E 3(画像生成AI)
4. Codex(コード生成AI)
5. Sora(動画生成AI)
OpenAIのプロダクト料金についてはこちらをご覧ください。
1ドル=153.43円(12月18日 6:25 UTC)
生成AIモデル一覧
1. テキスト生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
ChatGPT(GPT-4) | 対話、文章作成、要約 | OpenAI | 無料版(GPT-3.5) / GPT-4: $20/月 |
Claude 3.5 Sonnet | 対話、長文理解、要約 | Anthropic | 無料版あり / Pro版: $20~50/月 |
Gemini | 検索補助、知識提供 | 無料 | |
LLaMA 2 | テキスト生成、翻訳 | Meta | 無料(商用利用には許可が必要) |
Jasper AI | マーケティング文書作成 | Jasper | $49/月~(Starterプラン) |
-
ChatGPT(チャットジーピーティ)
概要:OpenAIが開発した対話型AI。GPTモデルを基に自然な会話が可能。
用途:カスタマーサポート、学習支援や情報検索、創作活動(ストーリーや詩の作成)
公開:2022年11月30日に公開され、日本対応版を2023年5月26日にリリース -
GPT
概要:OpenAIの最先端テキスト生成モデル。高度な自然言語処理が可能。
用途:データ分析、プレゼン資料作成、長文記事の執筆や要約
公開:2018年6月11日に発表され、以降複数のバージョンがリリースされている -
Claude(クロード)
概要:Anthropicが開発したAI。倫理性と安全性を重視した設計。
用途:対話、コンテンツ生成、コード生成や問題解決
公開:2023年3月14日に一般公開され、以降複数のバージョンがリリースされている -
Gemini(ジェミニ)、旧称Bard(バード)
概要:Googleが開発した生成AI。検索と連携して最新情報を基に回答を提供。
用途:情報収集、知識提供、日常会話、文書作成
公開:2023年3月21日にアメリカ合衆国とイギリスでリリース、2024年2月8日に名称をGeminiに変更するとともに、全世界で一般公開 -
ELYZA Pencil(イライザ ペンシル)(文章執筆)
-
Shikaki(シカキ)(歌詞・詩)
2. 画像生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
Stable Diffusion | 写真、アート、デザイン制作 | Stability AI | 無料(オープンソース) |
DALL·E 3 | テキストから画像生成 | OpenAI | ChatGPT Plusの$20/月に含まれる |
MidJourney | 独創的なアートやイラスト | MidJourney | $10~60/月(プランによる) |
DeepArt | 写真のスタイル変換 | DeepArt.io | 無料 / 高解像度は追加料金あり |
Canva Magic Design | デザイン作成支援 | Canva | 無料版あり / Pro版: ¥1,500/月 |
-
Stable Diffusion(ステイブル・ディフュージョン)
概要: Stability AIが開発した高品質な画像生成AI。
用途:写真のようなリアルな画像生成、クリエイティブなデザインやアート作成
公開:2022年8月22日に発表され、以降複数のバージョンがリリースされている -
DALL·E(ダリ)
概要: OpenAIが開発したテキストから画像を生成するAI。
用途:デザインや広告制作、キャラクターやアートの作成
公開:2021年1月5日に発表され、以降複数のバージョンがリリースされている -
MidJourney(ミッドジャーニー)
概要: アートやイラスト生成に特化した生成AI。
用途:独創的なアートやポスターの制作
公開:2022年7月13日にオープンベータ版への移行が発表
3. 音声生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
WaveNet | 音声アシスタント、ナレーション | Google DeepMind | Google Cloudの料金体系による |
Descript | ポッドキャスト編集、音声合成 | Descript | 無料版あり / Pro版: $12/月~ |
Resemble AI | 音声キャラクター作成 | Resemble AI | $30/月~(APIプランによる) |
Murf AI | 自然な音声生成、ナレーション | Murf.ai | 無料版あり / Pro版: $19/月~ |
Play.ht | 音声合成、テキスト読み上げ | Play.ht | $19/月~ |
-
WaveNet(ウェーブネット)
概要: 高品質な音声生成を可能にするAI。
用途:自然な音声アシスタントの構築、ナレーションや音声コンテンツ作成 -
Descript(ディスクリプション)
概要: 音声やポッドキャスト編集に特化した生成AI。
用途:音声編集、自動文字起こし。ナレーション生成。 -
Resemble AI(リゼンブルAI)
概要: カスタマイズ可能な音声合成AI。
用途:ユニークな音声キャラクターの作成。自然な音声での対話。
4. コード生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
GitHub Copilot | プログラム補完、エラー修正 | GitHub (OpenAI Codex) | $10/月(個人) / $19/月(企業) |
Codex | 自然言語からコード生成 | OpenAI | GPT API料金体系に準拠(使用量課金) |
Tabnine | コード補完 | Tabnine | 無料版あり / Pro版: $12/月 |
Amazon CodeWhisperer | コード生成、バグ修正 | Amazon Web Services | 無料版あり / 商用利用は別途課金 |
Replit Ghostwriter | コード補完、AI支援開発 | Replit | $10/月 |
-
GitHub Copilot(ギットハブ・コパイロット)
概要: OpenAIのCodexを基にしたプログラミング支援AI。
用途:コード補完、自動生成、エラー修正や効率化 -
OpenAI Codex(オープンエーアイ・コーデックス)
概要: 自然言語からプログラムコードを生成。
用途:アプリケーションやスクリプトの作成、プログラミング教育 -
Tabnine
概要: AIによるコード補完ツール。
用途:コード作成の自動化、プロジェクトの効率化
開発:2024年4月リリース
5. 動画生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
Runway Gen-2 | 動画素材作成、映像編集 | Runway | 無料版あり / Pro版: $12/月~ |
Synthesia | プレゼン動画、学習動画制作 | Synthesia | $30/動画~(1本ごとの料金) |
Pictory | ソーシャルメディア向け動画制作 | Pictory | $19/月~ |
DeepBrain AI | AIキャスターの動画生成 | DeepBrain AI | カスタムプラン(要問い合わせ) |
Kaiber AI | 音楽ビデオやアニメーション生成 | Kaiber | 無料トライアルあり / $10~20/月 |
-
Runway(ランウェイ)
概要: 動画編集と画像生成が可能な生成AIツール。
用途:クリエイティブな映像制作、動画素材の作成、加工、静止画の生成や補正
公開:2023年2月にリリース、以降複数のバージョンがリリースされている -
Synthesia(シンセシア)
概要: テキストから動画を生成するAI
用途:トレーニング動画やマーケティング動画の作成、バーチャルプレゼンテーション -
Pictory(ピクトリー)
概要: テキストや画像を基に動画を生成するAIツール
用途:ソーシャルメディア向けの動画作成、マーケティング素材の生成 -
sora(ソラ)
概要:文章や画像、動画を入力すると新たに短い動画を作れる生成AIで、2つの動画を混ぜて、1つの動画にもできる
用途:映像制作、動画編集の効率化、インタラクティブコンテンツの作成、字幕・翻訳のサポート
提供元:OpenAI (「ChatGPT」課金ユーザーなら追加負担なし)
6. その他の生成AI
モデル名 | 用途 | 提供元 | 利用金額 |
---|---|---|---|
Canva Magic Write | デザインと文章の自動生成 | Canva | 無料版あり / Pro版: ¥1,500/月 |
Deep Dream | 画像変換(幻想的なエフェクト) | 無料 | |
Gemini 1.5 Pro | マルチモーダル生成(テキスト、画像、音声) | 要問い合わせ(商用プラン提供) | |
Jukebox | 音楽生成 | OpenAI | 無料(研究用として提供) |
DreamFusion | テキストから3Dモデル生成 | Google Research | 無料(研究プロジェクト) |
-
Canva Magic Write(キャンバマジック作文)
概要: Canvaの生成AIで、デザインや文章を自動作成
用途:グラフィックデザイン、キャッチコピーの作成 -
Deep Dream(ディープドリーム)
概要: Googleが開発した画像変換AI
用途:画像に幻想的なエフェクトを追加
日本語対応の生成AIモデル真実性のスコア
NIKKEI Digital Governanceは、日本語に対応した50の生成AIのうち、どれが「ウソをつきにくい」モデルかを調べたそうです。
日本語対応50の生成AIモデルに関する調査
NIKKEI Digital Governance調査結果の表を引用(2024年10月時点)
- 最大100万トークンの大きなコンテキストウィンドウ1を持ち、長文の理解や生成が可能
- 効率的なMOE(Mixture of Experts)アーキテクチャを採用し、性能と効率性を両立
- テキスト、画像、音声、動画、コードなど多様な入力形式に対応
- DALL・E 3との連携により、テキストから高品質な画像生成が可能
- 高度な自然言語処理能力を持ち、複雑なタスクにも対応
- テキスト、画像、音声、動画に対応
3位:Claude 3.5 Sonnet(クロード 3.5 ソネット)
- 前モデル(Claude 3.5 Opus)に比べて処理速度が2倍に向上し、複雑なタスクにも迅速に対応可能
- 対話中に視覚的なコンテンツを生成・編集できる機能を搭載
- 日本語を含む多言語での自然な会話が可能で、他の生成AIに比べてより自然な対話ができる
人間にしかできないことは何?
AIは多くの分野で非常に高い能力を発揮していますが、人間が持つ独自の特性や能力はAIには再現できないものもあります。
人間にしかできない、あるいは現時点でAIが不得意な領域について調べてみました。
1. 創造性と感情的な深みを伴う芸術表現
-
人間特有の感情や体験に基づく創作
AIは既存データを基に新しいものを生成できますが、深い感情や哲学的な洞察、個人の体験に基づく表現はできない
(例: 人間の人生経験を反映した詩や音楽、絵画の作成) -
文化的・社会的な文脈に応じた創造
現在のAIは、文化や時代背景の繊細なニュアンスを完全に理解することはでない
2. 共感と感情の交流
-
相手の心情を深く理解し寄り添う能力
AIは感情認識技術を持っていますが、「共感」そのものは持っていない
(例: カウンセリングや介護、深い人間関係を築く対話) -
倫理的・感情的な判断
複雑な状況での道徳的判断や、人間関係に配慮した選択
3. 批判的思考と価値判断
-
未解決の問題に対する創造的解決
AIは与えられたルールやデータセットの中で最適解を探すことは得意ですが、ルールそのものを変える革新的な思考は人間固有の能力
(例: 科学的発見、新しい哲学的概念の提案) -
価値観に基づく判断
人間の倫理観や社会的背景を踏まえた判断は、人間でなければ難しい
(例: 倫理的なジレンマに直面したときの決定)
4. 感覚を伴う体験と行動
-
感覚と身体的な体験
AIは人間のように五感を持たず、直接的な体験を通じて得られる知識や感覚は持てない
(例: 美味しい食事を楽しむ、スポーツをする、楽器を演奏する) -
即座に柔軟な対応
人間は、予測不能な状況に直面しても、その場の感覚と経験をもとに即座に対応できる
(例: 自然災害時の救助活動や緊急事態での判断)
5. 人間同士の社会性
-
文化や社会的ルールの適応と発展
人間は社会や文化を創造し、それに応じて柔軟に行動を変えられるが、AIは与えられたルールに基づいて動作し、ルールそのものを進化させることはできない -
リーダーシップとチームビルディング
他者を鼓舞し、ビジョンを共有し、目標達成に向けて協力を促す
(例: リーダーシップを発揮してプロジェクトを推進)
6. 倫理観や哲学的思考
-
複雑な倫理的問題への対応
生命倫理や哲学的問い(例えば「人間とは何か」)を深く考え、答えを追求する力はAIにはない
(例: 死生観や幸福の定義に関する議論) -
倫理的責任の遂行
決定が社会や個人に与える影響を考え、その責任を取る行動
7. 未知への探求と適応
-
未知の分野への挑戦
AIは既存のデータやルールの範囲内でしか動けないが、人間は未知の問題や分野に好奇心を持ち挑戦できる
(例: 宇宙探査、新しい技術や科学理論の開発) -
進化的学習
人間は環境に応じて自分を変化させる能力を持ち、AIが模倣できない形で自己成長を遂げる
8. 人間の複雑なアイデンティティ
-
自己意識
AIには自己意識がなく、「自分が存在している」という感覚を持たない
(例: 自己のアイデンティティを考える哲学的探求) -
感情と意志の融合
人間は感情や意志を基に行動しますが、AIはプログラムされた指示に従うのみ
まとめ
人工知能(AI)はどんどん進化し、多くの分野で優れた効率性を発揮していますが、「感情」、「創造」、「社会性」、「倫理観」といった人間特有の能力は再現できません。
数年後にはAIによってなくなる仕事があると言われている現在。
人間にしか出来ないことを活かしながら、これからもうまく人工知能(AI)を活用して行きたいですね。
-
コンテキストウィンドウとはモデルが一度に処理できるトークン数、つまり入力できる情報量のこと ↩