2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

こちらの記事で触れていましたが、触ってませんでした。

インタラクティブなプロンプトインタフェースによるLLMプロジェクトの実行可能性の評価
プロンプトエンジニアリングは、あるユースケースを大規模言語モデル(LLM)で解決できるかどうかをクイックに評価できる優れた手法です。MLflow 2.7の新たなプロンプトエンジニアリングUIによって、ビジネスのステークホルダーは、新規にプロジェクトをスタートするのに十分なアウトプットを得られるのかどうかを確認するために、様々なベースモデル、パラメータ、プロンプトを用いて実験することができます。インタラクティブなプロンプトエンジニアリングツールにアクセスするには、シンプルに新たな空のエクスペリメントを作成するか、(既存のエクスペリメントを開き)New Runをクリックします。こちらからプレビューにサインアップできます。

上の記事を翻訳した際には申請が必要なプレビューでしたが、普通に使えるようになっていました。

準備

プロンプトを送信できるモデルサービングエンドポイントがあることを確認します。無い場合には作成してください。

エクスペリメントの作成

サイドメニューでエクスペリメントにアクセスして、従来型エクスペリメントを作成をクリックします。

Screenshot 2024-10-30 at 20.24.20.png

Screenshot 2024-10-30 at 20.24.33.png

プロンプトエンジニアリング

エクスペリメントが作成されたら、右上の新規ラン > プロンプトエンジニアリングの使用を選択します。

Screenshot 2024-10-30 at 20.24.43.png

ここでのエクスペリメントやランは、MLflowの用語です。

  • エクスペリメント: 後述のランを管理するための箱

  • ラン: 従来は一回の機械学習トレーニングを管理する単位でしたが、最近ではLLMにおけるトレーニング、ファインチューニング、評価、そして今回のようにプロンプトエンジニアリングの営みも管理できるようになっています。リンク先の説明も以下のようになっています。

    executions of some piece of data science code, for example, a single python train.py execution (単一のPythonのtrain.pyのようなある程度の規模のデータサイエンスコードの実行)

すると、新規にランを作成する画面が現れます。ここでプロンプトエンジニアリングを行うということですね。

Screenshot 2024-10-30 at 20.25.32.png

左上でモデルを選んで、プロンプトテンプレート、パラメーターを指定して評価をクリックするとレスポンスが帰ってきます。

Screenshot 2024-10-30 at 20.25.38.png

せっかくですので、日本語でやりましょう。以下のようなプロンプトテンプレートを指定します。

指定されたテキスト「{{ text }}」をメインのアイデアとキーポイントをカバーする簡潔で一貫性のある要約にまとめてください。要約は文字数 {{ word_count }} を超えないようにしてください。

二つの中括弧でパラメータを囲むと、それに合わせて画面更新されます。

Screenshot 2024-10-30 at 20.53.52.png

評価をしてもらいます。

Screenshot 2024-10-30 at 20.54.47.png

一旦これでランを作成をクリックして保存します。

Screenshot 2024-10-30 at 20.55.40.png

ここからはいくつかの方向性があります。

  • 他のテキストをプロンプトテンプレートに与える
  • モデルを切り替える
  • プロンプトテンプレートを変更する

ここでは、最初の二つを実際に行なってみます。

他のテキストをプロンプトテンプレートに与える

表の左にある + を押します。

Screenshot 2024-10-30 at 20.57.06.png

プロンプトテンプレートのパラメータが聞かれます。

Screenshot 2024-10-30 at 20.57.52.png

入力します。

Screenshot 2024-10-30 at 20.58.29.png

行が増えますがoutputは空です。セル内のEvaluateを押しましょう。

Screenshot 2024-10-30 at 20.58.40.png

新たなレスポンスを得ることができました。これを繰り返していくことで、プロンプトテンプレートの良し悪しを把握できるようになります。

Screenshot 2024-10-30 at 21.01.08.png

モデルを切り替える

再度、右上の新規ラン > プロンプトエンジニアリングの使用を選択します。今度は左上でモデルを変更します。

Screenshot 2024-10-30 at 21.02.46.png

新規ランとして保存します。

Screenshot 2024-10-30 at 21.03.10.png

今度は列が追加されました。先ほどと同じようにEvaluateあるいはすべて評価をクリックします。

Screenshot 2024-10-30 at 21.04.04.png

このように、さまざまな入力、モデルを組み合わせながらプロンプトテンプレートをブラッシュアップすることができます。

Screenshot 2024-10-30 at 21.05.07.png

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?