はじめに
本記事は、「初めての一人アドベンドカレンダー2024 by hohe」の2日目の記事となります。
Advent Calendar 期間中は、AWSの生成AI/ML関連を中心に記事を投稿していきます。
2日目は、生成AIとは何か、AWSの生成AIサービスにはどのようなものがあるかをまとめます。
生成AIとは
生成AI(Generative AI)とは、学習したデータから新しいコンテンツやアイデアを生み出す人工知能(AI)であり、従来のAIがあらかじめ決められた範囲内を自動化するのに対し、新しいコンテンツを生成できる点が生成AIとの違いです。
AI、機械学習、深層学習、生成AIとの違い
生成AIと似た概念として機械学習や深層学習などがありますが、生成AIは機械学習の手法の1つである深層学習によって知識を積み重ねることで、オリジナルのコンテンツを生成できるようになったAIの一種です。
そのため、概念的な広さ関係でいうと、以下のようになります。
AI>機械学習>深層学習>生成AI
また、各概念の簡単な概要は以下の通りです。
名称 | 詳細 |
---|---|
人工知能 (AI:Artificial Intelligence) |
⼈間の知的判断をコンピュータ上で実現するための技術全般 |
機械学習 (ML:Machine Learning) |
AIの⼀種で知的モデルを構築するためにデータの中の傾向を学習する技術であり、大きく「教師あり学習」「教師なし学習」「強化学習」の3種類が存在する ・教師あり学習:データに正解ラベルを付けてAIを学習 ・教師なし学習:データに正解ラベルを付けないでAIを学習 ・強化学習:試行錯誤しながらAI性能を最大化する学習 |
深層学習 (DL:Deep Learning) |
ML の⼀種であり、⾳声・画像認識などのタスクを深い複数レイヤー構造のニューラルネットワークで実現する技術 |
⽣成 AI (GenAI:Generative AI) |
深層学習によって大規模データを自ら学習することで、入力された指示にしたがって文章、画像、音楽などの新しいコンテンツを生成するAIであり、「テキスト生成」「画像生成」「動画生成」「音声生成」などの種類が存在する |
生成AIとLLMの違い
近年、注目を集めている技術として他にLLM(Large Language Models、大規模言語モデル)があります。生成AIが、画像・音声・文章などのデータを生成する人工知能技術の総称であるのに対し、LLMは生成AIのなかでもテキストデータを生成することに特化した技術であり、自然言語処理(NLP:Natural Language Processing)の分野で使用されます。膨大な量のテキストデータを学習し、人間のような自然な言語生成や理解を実現します。
AWSのAIサービス
AWSで提供されているAIサービス
AWSでは2024年12月時点では主に以下のようなAIサービスが提供されています。
- Amazon Q
- Amazon Bedrock
- Amazon Transcribe
- Amazon Polly
- Amazon Textract
- Amazon Rekognition
- Amazon Lex
- Amazon Translate
- Amazon Personalize
- Amazon Augumented AI (Amazon A2I)
- Amazon Comprehend
- Amazon Fraud Detector
- Amazon Kendra
サービスごとの概要
以下で各サービスの概要をまとめます。
サービス名 | 概要 | できること |
---|---|---|
Amazon Q | 生成AIを活用したフルマネージドなAIアシスタントサービス | 企業のシステム内のデータや情報に基づいて、質問への回答、要約の提供、コンテンツの生成、およびタスクの安全な実行を行う |
Amazon Bedrock | 大手AI企業の高性能なAIモデルを利用できるフルマネージドな生成AIサービス | 単一の API を介して大手 AI 企業からの高性能な基盤モデル (FM) を選択できるフルマネージドサービスで、セキュリティ、プライバシー、責任ある AI を備えた生成 AI アプリケーションを構築するために必要な幅広い機能を提供する |
Amazon Transcribe | フルマネージド型の自動音声認識サービス | 音声をテキストに変換する機能を任意のアプリケーションに簡単に追加できるようにする |
Amazon Polly | オンデマンドで音声を生成し、あらゆるテキストを音声ストリームに変換するフルマネージドサービス | 既存のアプリケーションに優れた会話機能を提供、何十種類ものリアルな音声を複数の言語でサポートしているため、最適な音声を選択して、音声対応アプリケーションを多くの地域で配信できる |
Amazon Textract | ファイルからテキストを抽出するフルマネージドな機械学習サービス | スキャンしたドキュメントからテキスト、手書き文字、レイアウト要素、データをあらゆるドキュメントから自動的に抽出する |
Amazon Rekognition | 機械学習を使用した画像・動画認識サービス | 事前トレーニングされたカスタマイズ可能なコンピュータビジョン (CV) 機能を提供して、画像と動画から情報とインサイトを抽出する |
Amazon Lex | 音声やテキストを使用したチャットボット構築サービス | ユーザーが自然言語の音声またはチャットを使用して任意のアプリケーションとインタラクションできるようにする AI チャットビルダーであり、任意のアプリケーション用の会話型AIインターフェイスを構築およびデプロイする |
Amazon Translate | ニューラル機械翻訳サービス | 高速で高品質かつカスタマイズ可能な言語翻訳を提供する |
Amazon Personalize | ユーザー向けにパーソナライズしたレコメンデーションを提供するフルマネージドな機械学習サービス | 高度にパーソナライズされたユーザーエクスペリエンスをリアルタイムで大規模に提供する |
Amazon Augumented AI (Amazon A2I) |
機械学習の結果に対して、実際の人間によるチェックを含めたワークフローを提供するサービス | 機械学習アプリケーションの人によるレビューを簡単に構築および管理する |
Amazon Comprehend | 機械学習を利用した自然言語解析サービス | ドキュメント、カスタマーサポートチケット、製品レビュー、電子メール、ソーシャルメディアフィードなどに含まれるテキストから、価値あるインサイトを発見する |
Amazon Fraud Detector | 機械学習を利用した不正検出サービス | オンライン支払い詐欺や偽アカウントの作成など、不正の可能性があるオンラインアクティビティを簡単に識別できるようにする |
Amazon Kendra | 機械学習を利用したエンタープライズ向け検索サービス | 組み込みコネクタを使用してさまざまなコンテンツリポジトリを検索できるようにするインテリジェントなエンタープライズ検索サービス |
おわりに
本投稿では、生成AIおよびAWSの主なAIサービスについて簡単にまとめてみました。整理していく上で、多くの生成AIサービスがすでに提供されていることを知ることができました。各サービスや今回は出てきていないAmazon SageMakerなどについてはこれから深掘りしていきたいと思います。