1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ローカルLLMを使い無料でPDFを「見た目そのまま」翻訳する:品質・速度の確認

Posted at

0. 要約

  • 目的:クラウドAPI(OpenAIなど)を使わず、ローカル環境で高品質PDF翻訳を実現する
  • 結論(macOS M3 Pro / 36GB 実測)
    • 最もバランス良好:gemma3-12b(品質・速度の両立)
    • 最も高品質:gemma3-27b(ただし最遅)
    • 最も高速:gemma3-4b(速報用)
    • 非推奨:LibreTranslate / LTengine4b(誤訳・文法破綻が多発)

1. はじめに

前回は OpenAI API(gpt-4.1-mini)を利用して、PDFのレイアウトを保持したまま翻訳できるツール を作成しました。

今回は「クラウド非依存・無料・ローカル完結」をテーマに、 ローカルLLM(Ollama / LTEngine / LibreTranslate)を利用してPDF翻訳を実現します。

検証は Apple M3 Pro(11コア・36GB RAM)搭載MacBook Pro 上で行い、PDF翻訳時の 翻訳品質処理速度 の両面を比較しました。 企業資料(提案書形式PDF)のサンプル を対象に、翻訳結果を 忠実度・自然度・処理時間 の3軸で総合評価しています。

2. 評価環境と方法

項目 内容
対象PDF test_slides.pdf(企業提案書形式、84 spans)
評価軸 忠実度・英文自然度・文法整合性・専門語訳精度・処理速度
ハードウェア macOS 15.7.1 / Apple M3 Pro(11コア) / メモリ 36GB
計測方法 time uv run python main.py -m
翻訳ツール Ollama(Gemma 3系)、LTEngine、LibreTranslate
出力PDF群 各モデル出力を手動比較(構造・語彙・文法を確認)

評価に使用したソースコード

3. テスト結果(速度・品質の総合比較)

モデル名 忠実度 英文自然度 文法整合性 専門語訳精度 所要時間(total) 総合スコア(品質+速度)
gpt-4.1-mini ★★★★★ ★★★★★ ★★★★★ ★★★★★ 7.4s 97.5 / 高速
gemma3-27b ★★★★★ ★★★★★ ★★★★★ ★★★★★ 378s (6:18) 97.0 / 低速
gemma3-12b ★★★★★ ★★★★☆ ★★★★★ ★★★★★ 183s (3:03) 96.5 / 中速
gemma3-4b ★★★☆☆ ★★★☆☆ ★★★☆☆ ★★★☆☆ 71s (1:11) 82.5 / 中速
ltengine12b ★★★☆☆ ★★★★☆ ★★★☆☆ ★★★☆☆ 83s (1:22) 77.5 / 中速
ltengine4b ★★☆☆☆ ★★☆☆☆ ★★☆☆☆ ★☆☆☆☆ 32.8s 27.5 / 高速
libre ★☆☆☆☆ ★☆☆☆☆ ★☆☆☆☆ ★☆☆☆☆ 33.5s 20.0 / 高速

4. セクション別品質分析

翻訳結果

表紙・タイトル

  • 優秀: gpt-4.1-mini, gemma3-27b, gemma3-12b
    → 「To anticipate market changes and lead to a new stage of growth.」
    忠実・自然で構文保持も良好
  • 不良: libre, ltengine4b
    → プロンプト残留や語順崩壊
モデル名 翻訳サンプル画像
オリジナル image.png
gemma3-12b gemma3-12b
ltengine4b ltengine4b
libre libre

成果物(Deliverables)

  • gemma3-12b/27b, gpt-4.1-mini: 数値整合・文脈忠実
  • ltengine12b: 文法破綻あり
  • libre: 無意味な英文混入
モデル名 翻訳サンプル画像
オリジナル original
gemma3-12b gemma3-12b
ltengine12b ltengine12b
libre libre

トレンド分析

  • gemma3-12b/27b:
    「季節要因の影響が小さい安定的な傾向」→ “a stable trend with little influence from seasonal factors.” (良い翻訳ができている)
  • gemma3-4b: 要約傾向と翻訳ミス
  • libre: 文法崩壊
モデル名 翻訳サンプル画像
オリジナル original
gemma3-12b gemma3-12b
gemma3-4b gemma3-4b
libre libre

「1月」が January ではなく 1 month と誤訳される理由は、 GoogleスライドをPDFに変換する際に発生する 文字分解の構造的問題 にあります。

具体的には、スライド上の「1月」という文字列がPDF化の過程で 「1」と「月」という 2つの独立したテキストオブジェクト に分割されてしまうため、 翻訳エンジンはこれを「1(数値)」と「month(月)」という別の単語として認識し、 結果的に「January」ではなく “1 month” と誤訳してしまうのです。

5. 処理速度比較

モデル 処理時間 (秒) 相対速度指数(基準=gpt-4.1-mini=1.0)
gpt-4.1-mini 7.4 1.0x(最速)
ltengine4b 32.8 4.4x
libre 33.5 4.5x
gemma3-4b 71.2 9.6x
ltengine12b 82.8 11.2x
gemma3-12b 183.2 24.8x
gemma3-27b 378.1 51.3x(最遅)

6. 総合評価(品質 × 速度)

順位 モデル 総評
🥇 gpt-4.1-mini 高品質・超高速 比較基準モデル
🥈 gemma3-27b 最高品質 (外部提出・契約文書向け)
🥉 gemma3-12b バランス最良 (社内・業務用途に最適)
4位 gemma3-4b 速報・草稿翻訳向け
5位 ltengine12b 可読だが構文乱れ
6位 ltengine4b 高速だが誤訳・脱落
7位 libre 破綻・ノイズ混入

7. 推奨構成

用途 推奨モデル 理由
高品質最優先 gemma3-27b gpt-4.1-miniに匹敵する精度に見える。(長文・公式提案書向け)
実用バランス型 gemma3-12b 高精度・安定構文 (実務翻訳の標準 )
速度重視(速報・一次訳) gemma3-4b 約1分で完了 (速報・試訳に適す)

この構成により、セキュリティ要件を満たしつつ高品質な翻訳をローカル環境で完結できる。M3 Proクラスでも十分実用的であり、業務翻訳を完全オンプレで安定稼働させることが可能である。

非推奨

  • ltengine4b / libre:誤訳多数・文法破綻・ノイズ
  • ltengine12b:主従関係崩壊。業務利用は推奨せず
1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?