AIでChangeLog翻訳とHTMLタグ付けを同時に処理:Claude・ChatGPT・Geminiなど7サービス精度比較
前文
「そうだ、AIを使ったらHTMLタグ付けも和訳もいっぺんに出来るんじゃ…?!」と今更ながら気づいた。Claude・ChatGPT・Gemini・Copilot・Grok・DeepSeek・Perplexityの7サービスを使ってみた検証結果の記録。
✅ 実際に使ったプロンプトも公開
✅ それぞれのAIサービスのアイコン画像付き ↔︎ 親切・分かりやすさ
📅 検証日:2026/05/07
用語・略語や前提
この記事における用語や略語や前提をはじめに記しておきます。
用語・略語について
- ChangeLog:アプリやソフトウェアのアップデート内容をまとめたリリースノート。今回の検証で使ったのは英文しかない・文章としてコピペ出来ない仕様(ずばり「Guitar Pro 8」のリリースノートです)
- ScnSht:スクリーンショットの略
- cap:キャプチャーの略、スクリーンショットとほぼ同じ意味
- Fire Alpaca:無料の画像編集ソフト( Win / Mac / Linux )。レイヤー機能でスクロールが必要なScnSht画を1枚の縦長画像に合成するために使用
- プレビュー.app:MacOS標準画像編集ソフト/アプリ。トリミング(Crop,上下左右の余白=辺を削ること)やPDF書き出しに使用
- En版 / Ja版:英語版 / 日本語版の略
前提
-
パーソナライズ設定:各AIサービスは事前に同じパーソナライズ設定済みの状態 ※ただしCopilot、DeepSeekは除く
- AIサービスによって名称や(パーソナライズ、カスタム指示etc)設定する場所までの行き方などは異なるが、本記事では同じことを指しているものとする
-
AIモデル:各AIサービスはどれも無料プランで初期表示のAIモデル。すなわち2026年5月上旬現在で
- Gemini〈Gemini 3 Flash〉
高速モード - Claude〈Sonnet 4.6〉
- ChatGPT〈GPT-5.5〉...の多分Instant
- ※GPT-5.5 Instant(2026年5月)、 GPT-5.3 Instant(2026年3月)
- Copilot〈総合的*〉
Smartモード - Grock〈Grock*〉
速いモード - DeepSeeek〈DeepSeek-V3〉
- Perplexity〈初期値*〉
※書式「各AIサービス〈AIモデル名〉」、モデルが特にない総合的なやつや初期値のやつは「*」付き
- Gemini〈Gemini 3 Flash〉
-
AIボット:今回は検証の対象外。色々なAI系サービス/オールインワン系のAIサービスで作成できたりする機能。
- 限定的な「できる事」をカスタムして作ることができる。これを使えば毎回プロンプト入力せず、そのAIボットで作業させることができる。特定のタスクに先鋭化・最適化された専用ツールを自作するようなもの
- オールインワン系のAIサービスでは機能を使うとクレジット消費しがち。上記に挙げたAIサービスではクレジット消費とかないから(無料プランでできる処理のうち)
-
Webサイト版:パソコンで使用、スマホでのアプリ版ではない
-
プロンプト文の文章違いver:同じ指示文の意味になる(はずの)違う文章、は試してない
前提 補足
パーソナライズ設定する場所についてのQiita記事を別途作った
→ ref) パーソナライズ設定の場所と項目名:Gemini・Claude・ChatGPT・Copilot・Grok・DeepSeek・Perplexity 7つのAIサービス
※パーソナライズ設定以外にも 回答スタイルをselectから選んでカスタムできる場合はしてる(ChatGPT, Claudeなど)
※メモリの記憶:ON (トグルでON/OFF設定できる)
※Perplexity は “検索”を中心にした 「AI搭載検索エンジン」 寄りで(中略)「検索+情報整理+引用の設計」と言うのが最も実態に近い。らしい。
→ ref) ChatGPT 「Perplexityと他AIの違い」より
まず結果を言うと
- 望んだ通りの整形結果が出たのはClaudeとCopilotのみ
- 他の5サービスはtxtからにしろPDFからにしろ、整形結果は同じようにNG
- 英単語の綴りミスを自動修正したのはClaudeとDeepSeekのみ
結果からの気づき
✔︎ 今回のお題&検証では Claude が最良の結果という事に
✔︎ Copilot はAIモデルにChatGPTも活用した独自チューニングのAIモデル(AIエンジン)とのことだが、その通り ChatGPT とは違う結果 になったとことが伺える
背景と動機・作業フロー比較
使っているソフト/アプリのChangeLogを、英語のまま&日本語訳の両方をブログ記事に載せている。この作業がそれなりに手間だった。AI使うと工程と作業量を減らせる。
| 今まで | これから | |
|---|---|---|
| ステップ数 | 6ステップ | 5ステップ |
| txtファイルの手動編集 | En版・Ja版それぞれ必要 | 不要 |
| HTMLタグ付け | 手動 | AIが一括 |
| 翻訳 | DeepLデスクトップ版 → 手動整形 | AIが一括 |
ただし希望通りの整形結果を出せたのは先に言及した通りClaudeのみ。
🌀 今まで(6ステップ)
- Fire Alpaca で合成:ScnShtを撮ってレイヤーにして1枚の縦長画像に合成する編集
-
DeepLデスクトップ版:英文を 範囲選択のキャプチャで取り込み &和訳 まで一気(文字列の範囲選択ではなく画像をScnShtする要領)
- ただし 改行がまったくされてない状態 のため(読みずらっ)、改行・空白行を手動で整える必要あり ※1
- DeepL:英文をtxtで保存、和訳をtxtで保存
- text系Editor:En版にHTMLタグ付け、タグ付きtxtとして保存
- 手作業で体裁を整える ※2 ※3
- text系Editor:Ja版にHTMLタグ付け、タグ付きtxtとして保存
- 手作業で体裁を整える ※2 ※3
- 記事化:ブログ本文の該当箇所にEn版とJa版をそれぞれコピペ
✔︎ これだって実は、手順2 のDeepLデスクトップ版の恩恵により、以前やってたやり方より断然作業量が減ってはいる(入力欄に貼り付け&和訳まではショートカット使って1アクション)。以前は 英文をタイピングして書き起こすという作業をしてからDeepLに突っ込んでいた。
🌀これから(5ステップ)
- Fire Alpaca で合成:ScnShtを撮ってレイヤーにして1枚の縦長画像に合成する編集
- プレビュー.app でトリミングなど調整してPDF化(En版)※4
- PDFをAIに読み込ませてEn版とJa版それぞれHTMLタグ付けを一気に
- 結果をDLかコピペしてEn版・Ja版をtxtとして保存
- 記事化:ブログ本文の該当箇所にEn版とJa版をそれぞれコピペ
...お分かりいただけただろうか...?
単に6ステップ→5ステップと、1ステップ減ったのではなく、手順3〜5でtxtファイルを自分で編集・用意する工程がまるごとなくなる わけだ。
➡︎ 作業量も時間も大幅に減る。
註
※1)DeepLデスクトップ版での取り込み&和訳は一息に済むが、改行が一切されない状態になる。改行・空白行を手動で入れる編集が必要。
※2)ブログ記事の改行設定との兼ね合いで、txt的改行とHTML的改行が混在した状態が必要になる。
※3)対象のタグは <h4>・<h5>・<ul>・<li> のみ。改行や空白の位置も含めて手動で整える必要がある。
※4)プレビュー.appでPDF化する方法は2通りある:
ファイル › プリントする... ⌘+P
ファイル › PDFとして書き出す... ⌘+P
PDF化後の文字の大きさ(見え方)が両者で異なる、上下左右の余白の多さが違うため。両方試して字が大きい方(=余白が少ない方)を使った。
Fire Alpacaでの画像編集は自動化できていない
ScnShtを撮ってレイヤーにして×必要枚数分、ずらして全文が見える縦長画像に合成、不要部分の削除と位置微調整……という手間は今も変わらず残っている。ここも自動化できれば理想的なのだが、今回の “AI活用による作業量激減しようぜ” 検証の範囲外。
検証内容・プロンプト
最初は単に txt → HTMLタグ付き化 をしてもらえばいいじゃーん、と思いついたので、txtからHTMLタグ付き化を実践した。
『! …英文PDF状態から読み取ってもらえばいいんじゃん??!!』と気づいたのは そのあとのこと。
プロンプト①、プロンプト② について共通
※ 実際は各AIのプロンプト内では </h4>や<li> はそのまま書いたが、このQiita記事 引用ブロック上でそれをやるとhtmlタグとして効いてしまうので</h4>や<li>のインラインコードで書いている
※ 'Release Note' は正確には 'Release Notes' なのだが、検証結果に影響はなかった模様
プロンプト①:txt → HTMLタグ付き整形(En版・Ja版)
txtファイルを渡して英語版・日本語版それぞれHTMLタグ付きで整形させる。タグの構造・改行ルール・冒頭3行の扱いまで細かく指定することで、コピペしてすぐ使える状態を目指している。
プロンプト①:txt → HTMLタグ付き整形(En版・Ja版)
添付したtextベースの英語または日本語のChangeLogに html の h4見出しと ul と li のタグをつけてください。その際
</h4>の次に改行なしで<ul>、<li>と</li>を1行とし</ul>後は1行空白をあけて<h4>とする事。
h4、(必要に応じて h5)、 ul、li(行頭の「-」や「• 」を削除して li タグに整形)のタグを付けhtml整形してください。添付したtextベースの冒頭3行ほどの扱いについて。原則プレーンな状態のままこの変換に加える。もし、"【"〜"】"で囲われた箇所があればその分は削除する。もし、"Release Note"後に改行でバージョン番号(例 8.1.x などの書式)がある場合は"Release Note"後に半角スペースでバージョン番号を配置。バージョン番号の後に1行空白をあけて、上記で指示したhtmlタグを付けてください。
プロンプト②:PDF → HTMLタグ付き整形+翻訳(En版・Ja版)
PDFを直接渡してタグ付き整形と和訳を一発でこなさせる。内容としてはプロンプト①の指示に加え、英語版・日本語版の両方を同時に出力するよう言ってる。
プロンプト②:PDF → HTMLタグ付き整形+翻訳(En版・Ja版)
添付したpdfのChangelog文書を html の h4見出しと ul と li のタグをつけたtxtに整形するお仕事です。英語のままと日本語版が必要です。pdfの冒頭3行ほどの本文(リスト)が始まる前の部分の扱いについて:原則プレーンな状態のまま変換し、"Release Notes" 後のバージョン番号(例 8.1.x などの書式)は "Release Notes" 後に半角スペースでVer番号を配置。Ver番号の後に1行空白をあけ、h4見出しとulを付けていってください。 その際
</h4>の次に改行なしで<ul>、<li>と</li>を1行とし</ul>後は1行空白をあけて<h4>とする事。全体として、h4、(必要に応じて h5)、 ul、li(行頭の「-」または「• 」を削除して li タグに整形)のタグを付けhtml整形したtxtにしてください。
では、上記で指示の通りタグ付け・整形したtxtを英語版と日本語版で用意してください。
検証結果(表)
txtからにしてもpdfからにしても違いはなかった。記事冒頭でも書いた通り
- 望んだ通りの整形結果が出たのはClaudeとCopilotのみ
ということ。つまり各AIサービスの結果は
txt → HTMLタグ付き整形(En版・Ja版) にしろ、
PDF → HTMLタグ付き整形+翻訳(En版・Ja版) にしろ、
総合して4段階評価「★」マークではこう:
| AIサービス | 評価 | |
|---|---|---|
![]() |
Gemini | ☆☆☆☆ |
![]() |
Claude | ★★★★ |
![]() |
ChatGPT | ★☆☆☆ |
![]() |
Copilot | ★★★☆ |
![]() |
Grok | ★☆☆☆ |
![]() |
DeepSeek | ★☆☆☆ |
![]() |
Perplexity | ★☆☆☆ |
これがすべてなのだけど、txtからのときとpdfからのときのそれぞれの評価をもう少し分かりやすく備考付きにしたものが「AIサービス別 評価(txtから)」と「AIサービス別 評価(PDFから)」の下記セクション。
AIサービス別 評価(txtから)
4段階評価で「★」マークと、備考。
AIサービス別 評価(PDFから)
4段階評価で「★」マークと、備考。
※⚠️:Grockの未検証については、まぁまぁ真夜中にやってたのにも関わらず「アクセスが集中しています」と、応答してもらえなかったため
ClaudeのPDFから版でのアーティファクトの件
Claudeはtxtからの場合と違い、pdfからでは結果をアーティファクトとして出してきた。
もし、Promptで「本文中にtxtで表示」と指示していたら、(txtからの場合と同じように)本文中に記述したのかも。その場合、アーティファクト用意のレンダリング時間がかからず、速度も体感上もっと短く応答を終えたのかも。
比較検証として共通プロンプトを使うという趣旨のため、今回はPrompt内に「本文中にtxtで表示」と書いた場合までは検証していない。
各AIの傾向と実感
7サービスを同じプロンプトで試して分かったのは、指示の忠実度にかなり差があるということ。
全く同じプロンプト使ってるのにこの差!
「タグ付けして」という大まかな指示はどのサービスもこなせる。ただ今回のように AIが間違わないよう・分かりやすいよう、順を追って指示、具体的には「</h4> の直後に改行なしで <ul>」「</ul> の後に1行空白」という 細部まで指示通りか となると、望み通りのものを提出してきたのは ClaudeとCopilotの2つだけだった。
コードに強いという評がよくつきがちなChatGPTも指示通り整形出来てない
また、Claude と DeepSeek は英単語の綴りミス("redudant" → "redundant")を自動で修正していた。指示外である英単語の誤りにも気づいて直してくれるのは実用上ありがたい。
PDFからの読み取り精度はtxtからの場合と大差ない結果で、PDFを経由することによる精度の劣化はほぼ感じないと言っていいと思われる(ファイルアップロードに多少時間かかったとこはある)。
和訳については、DeepLが「〜を修正しました」「〜ようになりました」句調なのに対し、今回どのAIサービスも「〜を修正」「〜ようになった」という語尾で、この点は個人的にはGood。語尾の句調に関してはDeepLで和訳してた時はわざわざこの語尾に修正してた位なので。
総じて、細かい指定を含むタスクほど、AIサービスによる結果の差があるという事に。汎用的な文章生成では差が見えにくくても、「これこれこのように」という指示(要件)が細かいほどその指示を守れるかどうかがハッキリする結果となった。
“読み取り能力”? “Codeの出力能力”?
- プロンプト文の意向を正確に汲み取れるかの “読み取り能力”?
- 正確に出力を施せるかの “Codeの出力能力”?
- またはその両方?
参考データ
チャットの自動命名比較
各AIサービスがどういう名前をつけるかも比べてみた。結構違う。個人的にはサイドバーの幅内に収まる文字数が好ましいんだが。
AIサービス名は共有リンクになっているので確かめたい方はどうぞ。
| AIサービス | 自動命名されたチャット名 | |
|---|---|---|
☆☆☆☆ |
Gemini | Changelog HTML Formatting Request |
★★★★ |
Claude | テキストベースのChangeLogをHTML形式に変換 |
★☆☆☆ |
ChatGPT | HTML整形の指示 |
★★★☆ |
Copilot | ChangeLogのHTML整形依頼 |
★☆☆☆ |
Grok | ChangeLog HTML整形(日本語・英語版) |
★☆☆☆ |
DeepSeek | HTMLタグ付け変更履歴 |
★☆☆☆ |
Perplexity | =自動で短いタイトルはつかない= |
プロンプト欄の表示挙動比較
プロンプトをコピペしたときの見え方と、送信後の(プロンプト欄の)表示の違いも各AIサービスによって異なる。
AIサービス名は共有リンクになっているので確かめたい方はどうぞ。
| AIサービス | コピペ後の表示 | 送信後のプロンプト文 | |
|---|---|---|---|
![]() |
Gemini | 改行・空白行:反映 | 全表示(☆:5行ほど+グラデなし) |
![]() |
Claude | 改行:反映 / 空白行:未反映 | 全表示(☆:8行ほど+グラデ) |
![]() |
ChatGPT | 改行・空白行:反映 → 詰まった文章 | 全表示 |
![]() |
Copilot | 改行・空白行:未反映 | 全表示 |
![]() |
Grok | 改行・空白行:反映 → ※⚠️ | 全表示 |
![]() |
Perplexity | 改行・空白行:未反映 → 詰まった文章 | 5行ほど表示+グラデ |
![]() |
DeepSeek | 改行・空白行:未反映 → 詰まった文章 | 全表示 |
※「☆」マーク:プロンプトの量が多ければ省スペース表示になる
※⚠️:Grokはプロンプト内の <h4> や <ul> などのHTMLタグが“ブラウザとしての画面表示”に反映されてしまったらしく、意図しない空白が生じた
スクリーンショット・画像素材
Release Notes 原本スクショ
以前からアップデートのお知らせはあった。キャプチャと翻訳作業をしたのがこの時期というだけ。
合成済み ReleaseNotes 画像
スクロールしないと全文が見えないため、画像ソフトで1枚に合成したもの。

ReleaseNotes 8.1.5-31 全文(画像ソフトで合成)
今回はたまたまこの長さ=文章量だっただけで、過去にはこの2倍以上だったり、もっと長かったこともある。
PDF化前の調整済み画像
プレビュー.appの「マークアップ」でトリミングした状態。これを元にPDF化。
※綴りミス箇所は「Engraving」の最初の項目、「Fix a redudant 」部:
正)redundant、誤)redudant

欄内のChangelog本文部のみにした状態
PDF化したもの...、は無理、PDFはQiitaでファイルアップロードできない、対象外。
┌::::::::::::::::┐
::::::::::::::::::
::::::::::::::::::
:::「PDF化前の調整済み画像」:::
::::::::::::::::::
::::::::の:::::::::
::::::::::::::::::
::::::上下左右に:::::::
::::::::::::::::::
:::余白がついた状態のもの::::
::::::::::::::::::
::::::::::::::::::
::::::::::::::::::
::::::::::::::::::
└::::::::::::::::┘
※プレビュー.appでPDF化する方法は2通りある:
ファイル › プリントする... ⌘+P
ファイル › PDFとして書き出す... ⌘+P
PDF化後の文字の大きさ(見え方)が両者で異なる。両方試して字が大きい方(=余白が少ない方)を使った。
今回は使ったのはPDFとして書き出す...で作成したものの方、余白が少なく文字が大きかったから。

pdf化: 余白比較 プレビュー.app 作成方法別
総括
作業の中核だった「DeepLで和訳 → 手動でタグ付け・整形 → txtで保存」の流れが、PDFをAIに渡すだけで出来る。自分で用意・編集するtxtファイルがなくなるのが一番大きい。
Fire Alpacaでの画像合成作業は引き続き残るわけだが、それ以外の工程は大幅に短縮!できることが分かった。
今回のこの件に限らずだが 個人的には、世間的に生成AIの代名詞みたいに言われてるChatGPTよりClaudeの方が良い結果になるという体感があり、今回ももれなくClaudeが優秀だったという話。
その他、使い心地に関係するあれやこれやとして
プロンプト文の文字数がある程度 多かったりしたときに
- 省スペース表示になるのかならないのか
- 送信済みプロンプト文の編集ができるのかできないか(枝分かれ、ブランチ)
や、
- Copilotはコピペでプロンプト埋めるならいいけどキーボード入力してたら変換や確定のつもりのリターン↩︎でまだ文章書き終わってないのに送信されてしまいがちで使いずらいナ!
- GrokやDeepSeekのページ右端にNotionで作ったWEBページのように目次を表す「ー」横線が並んでるの便利だな
- Grokは「アクセスが集中しています」と応答してもらえなえないことがままある感じだな
- Perplexityの背景色と文字色のコントラストちょっと見ずらいな(視認性が悪いな)
など、あと、行間や見出し文字の大きさ由来の、ぱっと見での把握のしやすさや読みやすさもあるので、そういったことも、どのAIサービスのページ・機能が満足いくか・使いやすいかに関わってくると思う。
個人的にはCopilotの 送信するつもりのないリターンで送信されてしまいがちな事や、「OK、〇〇」とか馴れ馴れしく呼び掛けられるのが本当にイヤなんだけど、
でも一方でCopilotの実務面が強いっぽいところやどこ開いてるかがスグ分かるページ色が濃い紺色(ダークモード時)なとこはアドバンテージなんだよなぁ。
以上です。







