0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Mistral AI(2. 2024年ごろ:le Chat, Mixtral 8x22B、Codestral、Mathtral、Mistral NeMo、Pixtral)

Posted at

本記事は下記の続きです。

le Chat Mistral

2024年2月、Mistral AIはMistralモデル(Mistral Large、Mistral Small、Mistral Next)を利用してビジネス環境に展開できる会話アシスタントのデモであるle Chat Mistralをベータユーザー向けにリリースした(ビジネス用途の、よりカスタマイズ性が高いle Chat Enterpriseの発表も同時に行った)1

le Chatはフランス語であり、「猫」という意味

Mistral AIのCEOであるArthur Mensch氏は、Mistralがdeveloper firstに焦点を置いており、AI開発者とユーザーの境界技術が薄いことをle Chatをリリースした理由の一つとして挙げている2。またle Chatは、ChatGPTの初期モデル(インタビュー内ではChatGPT version0と言われている)レベルの性能であり、さらに発展させてエンタープライズ系のソリューションにしていく意向についても言及している3

Mixtral 8x22B

2024年4月、Mistral AIはMixtral 8x22Bを発表した。2023年に発表されたMixtral 8x7Bと同様にオープンソース(Apache 2.0)であり、英語、フランス語、イタリア語、ドイツ語、スペイン語に対応している4。ただし、Mixtral 8x7Bに比べてContext windowが倍の64Kになっていることなど、性能向上しているのはもちろん、他の70Bクラスのモデルよりも高性能と謳われている。


Measure of the performance (MMLU) versus inference budget tradeoff (number of active parameters)

Codestral, Codestral Mamba

2024年5月、Mistral AI初のコーディングタスク専用に設計された生成AIモデルであるCodestralが発表された。80以上のプログラミング言語(Python, Java, C, C++, JavaScript, Bashなど)に対応しており5、他社製AIモデルと比べて、コンテキストウィンドウは大幅に大きい32k、コーディングパフォーマンスベンチマークのスコアは、ほぼすべてのベンチマークでトップクラスのスコアを記録している6。Codestralは、Fill-In-the-Middle(FIM)と呼ばれる部分的なコード記述を行うこと(VS Codeの変数名の補完のようなイメージ)も可能であり、開発体験を高めている57


Codestralベンチマーク

Mistral AIは、Codestralもオープンであると表現しているが、利用にあたりMistral AI non-production license (MNPL)というライセンスを導入している8。MNPLでは、Codestralとその成果物をいかなる商業活動においても使用すること、会社の事業活動の文脈で従業員が内部でCodestralを使用することなどを禁じている9。学習データに著作物があったなど、MNPL導入の理由については考察されているが10、Mistral AIから公式の説明はなく、今後はApache 2.0ライセンスで製品をリリースすることを宣言している11

Codestralに続いて7月に、これまで用いられたTransformerモデルとは異なるMambaというモデルを用いたCodestral Mambaというモデルがリリースされた12。Mambaは、選択的状態空間モデル(Selective SSM:Selective State Space Model)を用いることで、高速かつ効率的に長いcontext windowに対応することが可能であり13、Transformerを代替しうる有望なアーキテクチャであるとされている。Codestral Mamba は Apache 2.0 ライセンスで利用可能とされた12


Mamba model


Codestral Mamba performance

MathΣtral(Mathtral)

7月、Mistral AIは複雑で多段階の論理的推論を必要とする高度な数学的問題への取り組みを強化するためMathtralというモデルを発表した (Codestral Mambaと同日)。Mathtralは、数学の分野における人間と人工知能の発展を促進するミッションを掲げる非営利団体であるProject Numinaとコラボし、Mistral 7Bをベースに作られている14


Mathtral performance

Mistral NeMo

7月、12BサイズのMistral NeMoという言語モデルを発表した15。Mistral NeMoは、NVIDIAと共同で開発され、NVIDIA DGX Cloud AIプラットフォーム上で学習が行われており、NVIDIA NIM推論マイクロサービスとしてのパッケージ化、NVIDIA TensorRT-LLMエンジンによるパフォーマンス最適化された推論などNVIDIAサービスとの親和性が抜群である16。コンテキストウィンドウは128kと大きく、量子化を考慮した学習が行われているため、取り扱うデータのビット数が少ないことから高速な推論を可能とする、FP8推論が可能である17
OpenAIが開発した(オープンソース版の)TiktokenというトークナイザーをベースにしたTekkenと呼ばれるトークナイザーを用いており、以前のMistralモデルで使用されていたSentencePieceトークナイザーより効率的になっている18

NeMoはNeural Moduleの略19


Mistral NeMo permormance


Visualizing FP32, FP16, FP8, and INT8 precisions
通常はFP32かFP16が用いられる20

Pixtral 12B, Pixtral Large

2024年9月、Mistral AIは初のマルチモーダルモデルであるPixtral 12Bを発表した21。Microsoft Researchが2023年に発表したマルチモーダルモデルであるLLaVAのアーキテクチャに従い画像とテキストの入力を受け付けており、Vision encoderにPixtralVisionModel、Language encoderにMistralForCausalLMが用いられている22


Pixtral Model Architecture

11月には、Mistral Large 2 をベースに構築された 124BのマルチモーダルモデルであるPixtral Largeが発表された23


Pixtral performance

その他

2024年2月、Mistral AIはMicrosoft社との複数年のパートナーシップを結び、1600万ドルを出資された。最先端のAIインフラへのアクセスが可能となり、ユーザーはAzure AI StudioやAzure Machine LearningモデルカタログのModels as a Service (MaaS)を通じて、この日に発表されたMistral Large24を含めてMistralのモデルが利用できるようになった25。ただしこの提携は、市場の寡占化が進むとして、欧州全域で適用されるAI法の策定を進めてきたEUから激しく非難され、独占禁止法の調査を求める声が上がった2627
また同月、欧州の大手企業および行政機関に対してカスタマイズされた生成AIソリューションを提供するべく、DXのリーディング企業であるSopra Steria社との提携も発表された28
6月には、ベンチャーキャピタル企業であるGeneral Catalyst社主導する資金調達ラウンドで、Cisco Systems社やNVIDIA社などから6億ユーロを調達し、Mistral AIの評価額は58億ユーロとなったことが明らかになった(2023年12月の評価額は20億ユーロ)29
続いて7月には、フランスの3D CADやデジタルツイン関連のソリューションを提供するDassault Systèmes社と提携を結び、LLMaaS(LLM as a Service)、産業顧客の膨大なデータ資産の価値向上を30
10月にはQualcomm社と提携関係を結び、SnapdragonおよびQualcommプラットフォーム搭載デバイスへのMistralモデル搭載を目指す他31、様々な企業と提携関係を結んでいる。

  1. Le Chat

  2. Open sourcing the AI ecosystem ft. Arthur Mensch of Mistral AI and Matt Miller

  3. Fireside Chat w/ Mistral CEO, Arthur Mensch

  4. Cheaper, Better, Faster, Stronger

  5. Codestral 2

  6. Mistral AIが初のコーディング用生成AIモデル「Codestral」をリリース、80以上のプログラミング言語でトレーニング済み

  7. HuggingFace Model card: mistralai/Codestral-22B-v0.1

  8. [X post by Arthur Mensch at 11:12 PM · May 29, 2024

  9. Mistral AI Non-Production License

  10. Mistral releases Codestral, its first generative AI model for code

  11. The Mistral AI Non-Production License

  12. Codestral Mamba 2

  13. Codestral Mamba:Mistral AIのMamba搭載次世代型大規模言語モデル

  14. MathΣtral

  15. Mistral NeMo

  16. Mistral AI and NVIDIA Unveil Mistral NeMo 12B, a Cutting-Edge Enterprise AI Model

  17. 33% faster LLM inference with FP8 quantization

  18. 【解説】Tekken トークナイザーとは何か? 〜 Mistral が採用する新世代トークナイザーの特徴

  19. NeMo Fundamentals

  20. 量子化とは

  21. Announcing Pixtral 12B

  22. Pixtral

  23. Pixtral Large

  24. Au Large

  25. Microsoft and Mistral AI announce new partnership to accelerate AI innovation and introduce Mistral Large first on Azure

  26. Microsoft's deal with Mistral AI faces EU scrutiny

  27. Microsoftが新LLM開発の仏ミストラルAIとのパートナーシップを発表 市場独占の懸念からEUより調査要求が上がる

  28. Sopra Steria and Mistral AI Partner to Offer Advanced AI Solutions

  29. Mistral AI raises 600 mln euros in latest funding round

  30. Dassault Systèmes and Mistral AI Partner to Offer Trusted, AI-Powered Industry-Grade Solutions to Accelerate the Generative Economy

  31. Qualcomm and Mistral AI Partner to Bring New Generative AI Models to Edge Devices

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?