Multilingual E5 Embedding を HTTP Server化して利用する (Multilingual E5 Embedding Server : REST API)

Last updated at 2025-02-28Posted at 2024-12-23

Multilingual E5 Embeddingとは？

Multilingual E5 Embeddingは、Hugging Faceで提供されている94言語対応の大規模言語モデルです。このモデルは、以下の特徴を持っています：

基盤モデル: XLM-RoBERTaを基に構築。
トレーニングデータ: 多様な多言語データセットを使用。
適用分野: テキスト検索や意味的類似性の評価など。
互換性: PyTorchで実装され、Sentence Transformersと互換性があります。

高い精度と柔軟性を兼ね備えたこのモデルは、テキスト検索や文書間の類似性計算など、幅広いタスクでその性能を発揮します。詳細はHugging Faceの公式ページをご覧ください。

nlp4j-llm-embeddings-e5 のメリット

Embedding 処理を別コンポーネントに切り出して分散化することができます
システムの中で複数のコンポーネントでEmbeddingを利用したいときに、リソースを集中することができます (例: 複数のコンポーネントから呼び出し、GPUを用いて高速に Embedding処理を行う)
REST APIを利用できるようになることで、プログラムランタイムに依存しなくなります (Java, VBなどからも利用可能)

nlp4j-llm-embeddings-e5 – 実践的な活用法

nlp4j-llm-embeddings-e5リポジトリでは、この埋め込みモデルを活用した簡単なサーバーの構築方法を提供しています。以下にインストール方法と使い方を説明します。

インストール手順

リポジトリをクローン:

git clone https://github.com/oyahiroki/nlp4j-llm-embeddings-e5.git

ディレクトリを移動:
```
cd nlp4j-llm-embeddings-e5
```
必要な依存ライブラリをインストール:
```
pip install -r requirements.txt
```

ソースコードは以下のレポジトリで公開しています。

サーバーの起動

以下のコマンドでサーバーを起動します：

python3 nlp4j-embedding-server-e5.py

サーバーが起動すると、HTTPリクエストを介して埋め込み生成が可能になります。

Webブラウザで簡単に試す (2025-2-28更新)

単純に localhost:8888 を開くとテスト用画面になるようにしました。

Embedding, Semantic Search, Cosine Similarity を試せます。

REST APIの利用方法

GETリクエスト (URLエンコードなし)

curl http://127.0.0.1:8888/?text=これはテストです。

GETリクエスト (URLエンコードあり)

curl http://127.0.0.1:8888/?text=%E3%81%93%E3%82%8C%E3%81%AF%E3%83%86%E3%82%B9%E3%83%88%E3%81%A7%E3%81%99%E3%80%82

POSTリクエスト (JSON形式のリクエストボディ)

curl -X POST -H "Content-Type: application/json" -d '{"text":"これはテストです。"}' http://127.0.0.1:8888/

サンプルレスポンス

リクエストを送信すると、以下のようなJSONレスポンスが返されます：

{
  "message": "ok",
  "time": "2024-05-26T23:21:38",
  "text": "これはテストです。",
  "embeddings": [0.04231283441185951, -0.0035561583936214447, ... 0.022928446531295776]
}

このレスポンスには、入力テキスト、生成された埋め込み、リクエスト処理時間などが含まれます。

パフォーマンスとスケーラビリティ

サーバーのリソース使用状況

以下のコマンドでプロセスやGPUメモリ使用量を確認できます：

$ ps aux | grep python
$ nvidia-smi

結論

Multilingual E5 Embeddingは、簡単なAPIインターフェースを介して高度な多言語テキスト処理を実現する強力なツールです。その高い柔軟性とスケーラビリティにより、研究から実用的なアプリケーションまで幅広く活用できます。

ぜひ、このモデルを活用して多言語対応の自然言語処理プロジェクトを強化してください！

以上、ChatGPT も利用して作成しました。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up