Youtubeの英語字幕から難しい単語だけハイライトする拡張機能を作った

Last updated at 2026-04-24Posted at 2026-04-24

動機

これまで使っていたYouTubeの二重字幕拡張機能が使えなくなり、エラーの原因を調べているうちに「拡張機能ってどうやって作るんだろう」と興味を持ち、勉強も兼ねて自作してみることにしました。

YouTubeの英語字幕の中から「難しい英単語」だけをハイライトする拡張機能を作りました。

YouTube字幕上で難単語がハイライトされ、ホバーで意味が表示される様子です。

難単語を検出するには、まず基準となる単語データが必要です。
しかし「何をもって難しいとするか」の定義に悩みました。

調べたところ、英語にはCEFR（言語能力の国際指標）があるため、これを基準にすることにしました。

このデータセットは以下のような形式で、単語と難易度（A1〜C2）が紐づいています。

headword;pos;CEFR;CoreInventory 1;CoreInventory 2;Threshold
a;determiner;A1;;;
a.m.;adverb;A1;;;

今回は B1以上（英検準1級相当） の単語を抽出して使用しました。

しかし、このデータだけでは語彙数が不足していました。
そこで、単語頻度ベースのデータも追加しました。

このデータセットは単語の出現頻度をランキング化したもので、上位ほどよく使われる単語です。
ここから「低頻度の単語」を抽出することで、難単語を補完できると考えました。

最終的に、

を統合し、さらにDeepL APIを用いて日本語訳を付与しました。

実際に使ってみると、いくつか問題がありました。

特に単語の正規化（normalize）は大きな課題です。
本来はNLPの手法（lemmatizationなど）を使うべきですが、

を懸念し、今回は簡易的に語尾を削る実装にとどめました。

また、辞書データは権利関係が複雑なため公開は控えています。

開発当初はJavaScriptの知識がほとんどなかったため、
ChatGPTにコードを書いてもらいながら動作確認をしていました。

ただしこの方法だと、

を毎回行う必要があり、開発効率が悪いという問題がありました。

そこで調べた結果、Plasmo + TypeScript が良いと知り、作り直しました。

細かい修正をすぐに確認できるため、かなり快適になりました。

TypeScriptの良い学習になりましたが、バグ修正などに時間がかかり、完成まで約1か月かかりました。

今後は、

などを進めていきたいと考えています。