個人的なまとめ
引用元:
https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2023_reInvent2023digest_1201_v1.pdf
Compute編
AWS Graviton 4とEC2 R8gインスタンスを発表
- AWSが設計したARMベースのプロセッサ、AWS Graviton 4プロセッサを発表
- Graviton 3と比較して30%高速、50%多いコア数、75%広いメモリ帯域幅を提供
- Amazon EC2 R8gインスタンスで利用可能に
- 高性能なDB、インメモリキャッシュ、ビッグデータ分析に適する
- R7gと比較して3倍のvCPU/メモリを搭載
- プレビュー申込みを受付中
AWS Trainium 2とEC2 Trn2インスタンスを発表
- AWS Trainium 2チップを発表
- AWS Trainiumと比較してトレーニング処理が最大4倍高速、メモリ容量が3倍、エネルギー消費効率が2倍に
- Amazon EC2 Trn2インスタンスに搭載。1インスタンスあたり16器のTrainium 2を搭載する
- AWS EFAによるEC2 Ultra Clusterで、最大100,000のTrainium 2で処理を実行可能
- 最大65EFLOPSを発揮し、3,000億パラメータのLLMのトレーニングを数ヶ月から数週間の単位に短縮する
- 詳細は今後発表予定
Amazon EC2のハイメモリインスタンスU7iを発表
- 次世代のハイメモリインスタンス、Amazon EC2 U7iインスタンスを発表。最大32TiBのDDR5メモリを搭載、SAP HANAやOracle、SQL Serverなどインメモリデータベースに最適
- 第4世代のIntel Xeon Scalable Processor(Sapphire Rapids)を搭載し、現行のU-1インスタンスと比較し最大125%高い処理性能を発揮する
NVIDIAのGPUを搭載した3つのインスタンスをアナウンス
- NVIDIAの最新GPUを搭載した3種類のEC2インスタンスの登場をアナウンス。2024年に登場予定、乞うご期待
- Amazon EC2 P5e instance
NVIDIA H200 GPUを搭載。141GBのHBM3e GPUメモリを搭載し、H100と比較して1.7倍大容量で1.4倍高速。AWS Nitro Systemによる3,200GbpsのEFA
ネットワークで最新モデルの開発・学習に適する - Amazon EC2 G6e instance
NVIDIA L40S GPUを搭載。公開されているLLMや小規模言語モデルの学習・推論に。NVIDIA Omniverseを用いるデジタルツインアプリケーションにも - Amazon EC2 G6 instance
NVIDIA L4 GPUを搭載。自然言語処理や翻訳、動画解析、音声認識、グラフィクス処理などに最適な低コストでエネルギー効率の高い選択肢
- Amazon EC2 P5e instance
Amazon Qのインスタンス選定支援機能を発表
- 750以上のEC2インスタンスタイプから最適な選択を行うための支援を提供
- Amazon QがAWSドキュメントと管理コンソール内の情報を元にパーソナライズされた推奨情報を提示する
- 自然言語で追加質問を行うことで更に詳細なガイドを得ることもできる
- EC2管理コンソールからプレビュー利用可能
ENA Expressが58のインスタンスタイプに対応
- AWSのSRDプロトコルを使用してネットワークパフォーマンスを向上させるENA Expressが新たに58種類のインスタンスタイプで利用可能に
- 新しい世代のインスタンスタイプで、16vCPUから192vCPUの範囲のものが対象
- ENA ExpressはSRDを利用するが、OSやアプリケーションから意識する必要はない。普通にTCPやUDPで通信すれば、裏側でSRDが適用される
- 全リージョンで、追加費用なしで利用可能
Amazon BraketでBraket Directプログラムを発表
- AWSで量子コンピューティングについての研究とイノベーションを加速するプログラム、Braket Directを発表
- 様々な量子デバイスの容量を確保。量子コンピューティングの専門家と直接連携する機会を得られる
- IonQの新しいイオントラップ型デバイスであるForte等、新世代のデバイスへのアクセスもリクエストできる
- Braket Directはキャパシティを確保するため、利用可否の予測可能性向上にもつながる
- Braketが利用可能な全てのリージョンにて
#jawsug