LLM(Large Language Model)
大規模言語モデルの略で、自然言語処理と呼ばれる分野で使用されます。
『汎用的なテキストデータを使って学習されており、様々な自然言語処理タスクで高い性能を発揮します』
- 大規模なデータセットとパラメータを使用してトレーニングされ、非常に高い精度と多様なタスク処理能力を持ちます。
- 計算リソースを大量に必要としますが、より複雑なタスクや精度が求められる場面に適しています。
- 開発・運用には膨大なデータと計算リソース、長い時間が要するため、コストが高いという課題があります。
SLM(Small Language Model)
『パラメータ数が少なく、特定の分野やタスクに特化して学習されている』
- 計算リソースの効率性を重視し、比較的小規模なモデルサイズで構築される。
- トレーニングや推論が高速で、コストも低めである。
- コスト面や運用の柔軟性に優れ、スマートフォンなどのエッジデバイスで利用することもできます。
- SLM:効率性を重視
- LLM:性能を重視