DatabricksにおけるLLMOps

Posted at 2023-10-28

こちらのイベントで話した内容です。

資料のPDFはこちら。

今回の内容に関係するガバナンスのウェビナーを11月17日に開催します。講師は私です。

会社紹介。

MLOpsとは

MLOpsとは機械学習モデルライフサイクル全般を円滑にするために必要な体制・基盤・手法全般を意味します。

MLOps(Machine Learning Operations)とは、データサイエンスチーム、運用チームなど、機械学習モデルの構築・運用に関わるチームが協調し、円滑に機械学習モデルを運用していくための体制・基盤を構築すること、その概念全般を意味します。

LLMOpsはこの考え方をLLMに拡張したものです。

LLMOps(Large Language Model Operations)とは、データサイエンスチーム、運用チームなど、LLMの構築・運用に関わるチームが協調し、円滑にLLMを運用していくための体制・基盤を構築すること、その概念全般を意味します。

MLOpsはLLMで何が変わるのでしょうか？

LLMの特性	MLOpsの示唆
様々な形態でLLMを利用可能: 課金API経由での一般的なプロプライエタリモデル、OSSモデルすぐに利用できるオープンソースモデル特定のアプリケーションにファインチューンされたカスタムモデルカスタムの事前トレーニング済みモデル	開発プロセス: インクリメンタルな開発 APIからスタートしカスタムモデルへ
LLMは入力として自然言語のプロンプトを受け入れ: 期待するレスポンスを得るためにプロンプトエンジニアリングが可能	開発プロセス: LLMに問い合わせを行うテストテンプレートの設計が開発プロセスの重要な一部にアーティファクトのパッケージング: パッケージングされるアーティファクトとプロダクションにおけるプロンプトはモデルというよりパイプラインに
LLMにはサンプルやコンテキストを伴うプロンプトを指定可能	サービングのインフラストラクチャ: 適切なコンテキストの検索に使用されるベクトルデータベースのような外部ツール
サードパーティのAPIプロバイダー経由でプロプライエタリモデルやOSSモデルを利用可能	APIガバナンス: APIプロバイダーをスイッチできる選択可能性や柔軟性を持つために、APIガバナンスのための集中管理されたシステムを持つことが重要に
LLMは非常に大きなディープラーニングモデルであり、多くの場合、数Gバイトから数百Gバイトに	サービングのインフラストラクチャ: LLMのサービングにはGPUが必要モデルを動的にロードする必要がある場合には、高速なストレージが重要に
LLMにおいては、多くの場合、単一の「適切な」回答が存在しないため、従来のMLメトリクスを通じた評価が困難	人間のフィードバック: LLMの評価、テストで必要になることが多い将来的なファインチューニングのためには、テスト、モニタリングを含むMLOpsに直接組み込むことが重要に

これらの新たな要件に適合するために、多くの既存ツール、既存プロセスの修正は軽微です

開発、ステージング、プロダクションの分離は変わりません
パイプラインやモデルをプロダクションに移行する際に、Gitのバージョン管理とUnity CatalogにおけるMLflowモデルレジストリは依然として主要なパイプラインとなります。
データ管理に対するレイクハウスアーキテクチャは、効率性のために依然として適切で重要です。
既存のCI/CDインフラストラクチャには変更はありません。
モデルトレーニングのためのパイプライン、モデル推論のためのパイプラインなどを用いた、
モジュール化されたMLOpsの構造は同じです。