whisper.cpp でOpenAI Whisperのファインチューニングモデルを実行する方法のメモです。
# whisper.cpp のコンパイル
git clone https://github.com/ggerganov/whisper.cpp
cd whisper.cpp
make
# OpenAI Whisperのclone
git clone https://github.com/openai/whisper whisper
# ファインチューニングモデルを取得
git clone https://huggingface.co/clu-ling/whisper-large-v2-japanese-5k-steps
# ggmlの出力先ディレクトリ
mkdir outputs
# whisperのファインチューニングモデルをggmlに変換
python3 ./models/convert-h5-to-ggml.py whisper-large-v2-japanese-5k-steps whisper outputs
# 音声認識の実行
./main -m outputs/ggml-model.bin -l ja -nt -f path_to_audio.wav