初めに
2023 年 8 月 24 日、MetaAI は、テキスト プロンプトを使用してコードを生成できる大規模言語モデル (LLM) である Code Llama をリリースしました。 Code Llama は、コード タスクに関する公的に利用可能な LLM の最先端のものであり、現在の開発者にとってワークフローをより高速かつ効率的にし、コードを学習している人々の参入障壁を下げる可能性があります。
概要:
- 「Code Llama」は、コードおよび自然言語のプロンプトからコードとコードに関する自然言語を生成する能力を持つ最新のLLM(言語モデル)です。
- 「Code Llama」は、研究および商用利用のために無料で提供されています。
- 「Code Llama」は、Llama 2をベースに構築されており、次の3つのモデルが利用可能です:
- 基本となるコードモデル、「Code Llama」;
- Pythonに特化した「Code Llama - Python」;
- 自然言語の指示を理解するために微調整された「Code Llama - Instruct」。
- 独自のベンチマークテストによると、「Code Llama」は、コードタスクにおいて最先端の公開されているLLMを凌駕しました。
- 「Code Llama」は、コードや自然言語のプロンプトから(例:「フィボナッチ数列を出力する関数を書いてください。」など)コードやコードに関する自然言語を生成することができます。また、コードの補完やデバッグにも使用できます。このツールは、Python、C++、Java、PHP、Typescript(Javascript)、C#、Bashなど、今日最も人気のある言語をサポートしています。
利用申請:
https://ai.meta.com/resources/models-and-libraries/llama-downloads/
申請後、すぐに返信のメールが届きます。メールでモデルの利用方法を教えます。
モデルのダウンロード方法:
- GitHubのCode Llamaリポジトリを訪問し、README内の指示に従ってdownload.shスク プトを実行してください。
- 固有のカスタムURLが求められる際には、以下を挿入してください:
○○○ - ダウンロードするモデルの重みを選択してください。
提供された固有のカスタムURLは、モデルのダウンロードに24時間間有効であり、複数回リクエストを送信することができます。
モデル
以下のモデルが利用可能です:
CodeLlama-7b
CodeLlama-13b
CodeLlama-34b
CodeLlama-7b-Python
CodeLlama-13b-Python
CodeLlama-34b-Python
CodeLlama-7b-Instruct
CodeLlama-13b-Instruct
CodeLlama-34b-Instruct
モデル評価の結果
「Code Llama」の性能を既存のソリューションと比較するために、2つの人気のあるコーディングベンチマーク、HumanEvalとMostly Basic Python Programming(MBPP)を使用しました。HumanEvalは、モデルがドックストリングに基づいてコードを補完する能力をテストし、MBPPはモデルが説明に基づいてコードを記述する能力をテストします。
私たちのベンチマークテストによれば、「Code Llama」はオープンソースのコード専用LLMよりも優れたパフォーマンスを示し、Llama 2をも凌駕しました。たとえば、「Code Llama 34B」は、HumanEvalで53.7%、MBPPで56.2%というスコアを獲得し、他の最先端のオープンソリューションと比較して最も高い成績を収め、ChatGPTと同等の結果を示しました。
参照:
記事:https://ai.meta.com/blog/code-llama-large-language-model-coding/
論文:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/
Github: https://github.com/facebookresearch/codellama
Huggingface: https://huggingface.co/codellama