o1
「o1」は2024年9月にリリースされた、現時点での最新モデルです。「o1」シリーズは「Chain of Thought」機能により、既存のgpt4では弱かった推論の精度が高まったとのことです。
chatGPTの無料版を使うとバックでは「GPT-4o」と「GPT-4o mini」のモデルが動きます。ただし、「GPT-4o」の利用は限定的です。
月額$20を払ってPlusにすると「o1」「o1-mini」が使えるようになります。それ程バリバリ使わないので、月額$20は痛いなというような場合は、Difyで「o1」「o1-mini」モデルが使えるようになっているため、トークン単位で課金して利用することができます。トークン単位で課金すれば月$20以上かかってしまう場合は、chapGPTplusを利用することで、月$20で使い放題にできます。
Gemini 2.0 Flash Exp
2024年12月11日にリリースされた現時点での最新モデルです。OpenAIのo1と同じようにこちらも推論が強化されてます。昨今は推論モデルの競争が激化しているもようです。
command-r
最新モデルは2024年3月13日にリリースされています。OpenAIに比べると最新モデルのリリース頻度はそれほど高くはありません。rerankで有名なcohereですがLLMにも力を入れています。cohereだけにRAGに強いLLMをアピールしているようです。この辺は他社との差別化を図っているのでしょう。
claude-3.5-sonnet
Claude3の次バージョンとして、最新モデルが2024年6月21日にリリースされています。こちらもOpenAIと比べると最新モデルのリリース頻度はそれほど高くはありません。ベンチマークではgpt、geminiと比較してもまったく遜色がないようです。こちらのモデルはAWSのBedrockからでも利用できます。AmazonのTitanと上手い具合に共存して進んでいくものと想定されます。