本記事は下記の続きです。
le Chat Mistral
2024年2月、Mistral AIはMistralモデル(Mistral Large、Mistral Small、Mistral Next)を利用してビジネス環境に展開できる会話アシスタントのデモであるle Chat Mistralをベータユーザー向けにリリースした(ビジネス用途の、よりカスタマイズ性が高いle Chat Enterpriseの発表も同時に行った)1。
le Chatはフランス語であり、「猫」という意味
Mistral AIのCEOであるArthur Mensch氏は、Mistralがdeveloper firstに焦点を置いており、AI開発者とユーザーの境界技術が薄いことをle Chatをリリースした理由の一つとして挙げている2。またle Chatは、ChatGPTの初期モデル(インタビュー内ではChatGPT version0と言われている)レベルの性能であり、さらに発展させてエンタープライズ系のソリューションにしていく意向についても言及している3。
Mixtral 8x22B
2024年4月、Mistral AIはMixtral 8x22Bを発表した。2023年に発表されたMixtral 8x7Bと同様にオープンソース(Apache 2.0)であり、英語、フランス語、イタリア語、ドイツ語、スペイン語に対応している4。ただし、Mixtral 8x7Bに比べてContext windowが倍の64Kになっていることなど、性能向上しているのはもちろん、他の70Bクラスのモデルよりも高性能と謳われている。
Measure of the performance (MMLU) versus inference budget tradeoff (number of active parameters)
Codestral, Codestral Mamba
2024年5月、Mistral AI初のコーディングタスク専用に設計された生成AIモデルであるCodestralが発表された。80以上のプログラミング言語(Python, Java, C, C++, JavaScript, Bashなど)に対応しており5、他社製AIモデルと比べて、コンテキストウィンドウは大幅に大きい32k、コーディングパフォーマンスベンチマークのスコアは、ほぼすべてのベンチマークでトップクラスのスコアを記録している6。Codestralは、Fill-In-the-Middle(FIM)と呼ばれる部分的なコード記述を行うこと(VS Codeの変数名の補完のようなイメージ)も可能であり、開発体験を高めている57。
Mistral AIは、Codestralもオープンであると表現しているが、利用にあたりMistral AI non-production license (MNPL)というライセンスを導入している8。MNPLでは、Codestralとその成果物をいかなる商業活動においても使用すること、会社の事業活動の文脈で従業員が内部でCodestralを使用することなどを禁じている9。学習データに著作物があったなど、MNPL導入の理由については考察されているが10、Mistral AIから公式の説明はなく、今後はApache 2.0ライセンスで製品をリリースすることを宣言している11。
Codestralに続いて7月に、これまで用いられたTransformerモデルとは異なるMambaというモデルを用いたCodestral Mambaというモデルがリリースされた12。Mambaは、選択的状態空間モデル(Selective SSM:Selective State Space Model)を用いることで、高速かつ効率的に長いcontext windowに対応することが可能であり13、Transformerを代替しうる有望なアーキテクチャであるとされている。Codestral Mamba は Apache 2.0 ライセンスで利用可能とされた12。
MathΣtral(Mathtral)
7月、Mistral AIは複雑で多段階の論理的推論を必要とする高度な数学的問題への取り組みを強化するためMathtralというモデルを発表した (Codestral Mambaと同日)。Mathtralは、数学の分野における人間と人工知能の発展を促進するミッションを掲げる非営利団体であるProject Numinaとコラボし、Mistral 7Bをベースに作られている14。
Mistral NeMo
7月、12BサイズのMistral NeMoという言語モデルを発表した15。Mistral NeMoは、NVIDIAと共同で開発され、NVIDIA DGX Cloud AIプラットフォーム上で学習が行われており、NVIDIA NIM推論マイクロサービスとしてのパッケージ化、NVIDIA TensorRT-LLMエンジンによるパフォーマンス最適化された推論などNVIDIAサービスとの親和性が抜群である16。コンテキストウィンドウは128kと大きく、量子化を考慮した学習が行われているため、取り扱うデータのビット数が少ないことから高速な推論を可能とする、FP8推論が可能である17。
OpenAIが開発した(オープンソース版の)TiktokenというトークナイザーをベースにしたTekkenと呼ばれるトークナイザーを用いており、以前のMistralモデルで使用されていたSentencePieceトークナイザーより効率的になっている18。
NeMoはNeural Moduleの略19
Visualizing FP32, FP16, FP8, and INT8 precisions
通常はFP32かFP16が用いられる20
Pixtral 12B, Pixtral Large
2024年9月、Mistral AIは初のマルチモーダルモデルであるPixtral 12Bを発表した21。Microsoft Researchが2023年に発表したマルチモーダルモデルであるLLaVAのアーキテクチャに従い画像とテキストの入力を受け付けており、Vision encoderにPixtralVisionModel
、Language encoderにMistralForCausalLM
が用いられている22。
11月には、Mistral Large 2 をベースに構築された 124BのマルチモーダルモデルであるPixtral Largeが発表された23。
その他
2024年2月、Mistral AIはMicrosoft社との複数年のパートナーシップを結び、1600万ドルを出資された。最先端のAIインフラへのアクセスが可能となり、ユーザーはAzure AI StudioやAzure Machine LearningモデルカタログのModels as a Service (MaaS)を通じて、この日に発表されたMistral Large24を含めてMistralのモデルが利用できるようになった25。ただしこの提携は、市場の寡占化が進むとして、欧州全域で適用されるAI法の策定を進めてきたEUから激しく非難され、独占禁止法の調査を求める声が上がった2627。
また同月、欧州の大手企業および行政機関に対してカスタマイズされた生成AIソリューションを提供するべく、DXのリーディング企業であるSopra Steria社との提携も発表された28。
6月には、ベンチャーキャピタル企業であるGeneral Catalyst社主導する資金調達ラウンドで、Cisco Systems社やNVIDIA社などから6億ユーロを調達し、Mistral AIの評価額は58億ユーロとなったことが明らかになった(2023年12月の評価額は20億ユーロ)29。
続いて7月には、フランスの3D CADやデジタルツイン関連のソリューションを提供するDassault Systèmes社と提携を結び、LLMaaS(LLM as a Service)、産業顧客の膨大なデータ資産の価値向上を30、
10月にはQualcomm社と提携関係を結び、SnapdragonおよびQualcommプラットフォーム搭載デバイスへのMistralモデル搭載を目指す他31、様々な企業と提携関係を結んでいる。
-
Open sourcing the AI ecosystem ft. Arthur Mensch of Mistral AI and Matt Miller ↩
-
Mistral AIが初のコーディング用生成AIモデル「Codestral」をリリース、80以上のプログラミング言語でトレーニング済み ↩
-
[X post by Arthur Mensch at 11:12 PM · May 29, 2024 ↩
-
Mistral releases Codestral, its first generative AI model for code ↩
-
Mistral AI and NVIDIA Unveil Mistral NeMo 12B, a Cutting-Edge Enterprise AI Model ↩
-
Microsoft and Mistral AI announce new partnership to accelerate AI innovation and introduce Mistral Large first on Azure ↩
-
Microsoftが新LLM開発の仏ミストラルAIとのパートナーシップを発表 市場独占の懸念からEUより調査要求が上がる ↩
-
Sopra Steria and Mistral AI Partner to Offer Advanced AI Solutions ↩
-
Dassault Systèmes and Mistral AI Partner to Offer Trusted, AI-Powered Industry-Grade Solutions to Accelerate the Generative Economy ↩
-
Qualcomm and Mistral AI Partner to Bring New Generative AI Models to Edge Devices ↩