はじめに
スペクトル解析で「輝線を検出したい」とき、しばしば用いられる手法が matched filter(マッチドフィルタ) です(e.g., Rutledge et al. 2003, Miyazaki et al. 2016, Inoue et al. 2025)。
論文や実務の現場では、
輝線を探すなら、スペクトルの分解能と同じ幅のガウスで畳み込むと信号雑音比(signal-to-noise ratio; S/N)が最大化する。
と説明されることがよくあります。経験的にはよく知られた事実ですが、改めて考えてみるといくつかの疑問が浮かびます。
- 本当に分解能と同じ幅が常に最適なのか?
- 最適幅は背景レベルや輝線強度に依存しないのか?
- 真の輝線が有限な幅を持つ場合でも同じ結論が成り立つのか?
matched filter は本質的に「畳み込み」を通じて検出統計量を構成する手法です。その最適性は、仮定する信号モデルと雑音モデルの組み合わせによって決まります。したがって、「分解能幅が最適である」という主張も、何らかの統計モデルの下で成立しているはずです。
そこで本記事では、できるだけ単純なガウスモデルとポアソン統計を仮定し、検出の観点からフィルタ幅と S/N の関係を明示的に計算します。複雑な実装やモンテカルロ評価(e.g., Inoueらの実装コード)には立ち入らず、解析的に追える範囲で整理することを目的とします。
その結果として、「なぜ分解能幅が妥当とされるのか」、そして「どのような条件でそれが崩れるのか」を、数式のレベルで確認してみたいと思います。
1. 真のスペクトルと観測装置の分解能
まず、真のスペクトルを
S_{\rm true}(x) = C + A\,G_{\rm true}(x)
と書きます。
- $C$: 連続成分(簡単のため一様とする)
- $A$: 輝線の強度
- $G_{\rm true}(x)$: 真の輝線の形(ガウス幅 $\sigma_{\rm true}$ を持つとする)
観測装置はガウス応答 $R(x)$ を持つとします。分解能を $\sigma_{\rm inst}$ とすると、
R(x) = \frac{1}{\sqrt{2\pi}\sigma_{\rm inst}}
\exp\!\left(-\frac{x^2}{2\sigma_{\rm inst}^2}\right)
と書けます。
(分解能は厳密にはエネルギー依存性がありますが、ここでは簡略化します。)
観測されるスペクトル $N(x)$ は、真のスペクトル全体を応答関数で畳み込んだ形で表されます:
N(x) = (C + A\,G_{\rm true}) * R
ここで、定数の畳み込み $C * R = C$ を用いると、
N(x) = C + A\,(G_{\rm true} * R)(x)
となります。ガウス同士の畳み込みはガウスなので、
G_{\rm obs} = G_{\rm true} * R
と表すことにし、その幅は
\sigma_{\rm obs}^2 = \sigma_{\rm true}^2 + \sigma_{\rm inst}^2
となります。したがって、最終的に観測されるスペクトルは
N(x) = C + A\,G_{\rm obs}(x)
と書けます。つまり、この $N(x)$ がポアソン揺らぎを持って観測されます。
2. 検出に用いるフィルタ(正規化ガウス)
次に、検出に用いるフィルタ $f(x)$ を、正規化されたガウスとして
f(x) = \frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
と定義します。
ここでの目的はシンプルで、フィルタ幅 $σ_f$ をフリーパラメータとして、検出 S/N が最大になる $σ_f$ を求めることです。
(なお、実際の matched filter では領域を $\pm 3\sigma_f$ などに切って積分することがありますが、本記事では本質に集中するため、そのような細かい実装上の制約は考慮しないことにします。)
3. フィルタ後の信号 S(期待値)
フィルタをかけた後の「信号」の期待値は
S = \int A\,G_{\rm obs}(x)\,f(x)\,dx
となります。ここで
G_{\rm obs}(x) =
\frac{1}{\sqrt{2\pi}\sigma_{\rm obs}}
\exp\!\left(-\frac{x^2}{2\sigma_{\rm obs}^2}\right),
\qquad
f(x) =
\frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
はどちらも正規化されたガウスなので、分布の再生性より積分は、
S
= A \int G_{\rm obs}(x) f(x)\,dx
= A \frac{1}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}.
となります。
4. フィルタ後のノイズ
観測スペクトルの各ビンは互いに独立で、ポアソン分布に従うとします。このとき、ビンごとの分散は
\mathrm{Var}[N(x)] = C + A\,G_{\rm obs}(x)
となります。
フィルタ適用後の分散は、フィルタを重みとした加重平均になり、
\mathrm{Var}_{\rm filt}
= \int (C + A\,G_{\rm obs}(x))\, f(x)^2\,dx
= C\!\int f(x)^2 dx
+ A\!\int G_{\rm obs}(x) f(x)^2 dx
と分解できます。
ここで必要になる積分は 2 つです。
4.1 背景項
\int f(x)^2 dx
= \int
\left[
\frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
\right]^2
dx
= \frac{1}{2\sqrt{\pi}\sigma_f}.
4.2 輝線項
同様に、
\int G_{\rm obs}(x) f(x)^2 dx
= \int
\frac{1}{\sqrt{2\pi}\sigma_{\rm obs}}
e^{-x^2 / (2\sigma_{\rm obs}^2)}
\,
\frac{1}{(2\pi)\sigma_f^2}
e^{-x^2 / \sigma_f^2}
\,dx
をガウス積分として評価すると、
\int G_{\rm obs}(x) f(x)^2 dx
= \frac{1}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
となります。
したがって、フィルタ後の分散は
\mathrm{Var}_{\rm filt}
= \frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}.
ノイズの標準偏差は
\sigma_{\rm noise}
= \sqrt{\mathrm{Var}_{\rm filt}}
= \sqrt{
\frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
}.
5. 全体の S/N とその依存性
以上より、フィルタ後の信号雑音比は
\frac{S}{\sigma_{\rm noise}}
=
A \frac{1}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}
\left[
\frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
\right]^{-1/2}.
この式自体は複雑で見通しが悪く、厳密に最大値を解析的に求めるのは骨が折れます。
ただし、輝線サーチとして典型的に想定される 弱い輝線($C \gg A$)の場合には、
ノイズの式の第2項が無視できるため、
\frac{S}{\sigma_{\rm noise}}
\approx
\frac{A}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}
\left(\frac{2\sqrt{\pi}\,\sigma_f}{C}\right)^{1/2}
\propto
\left(
\frac{\sigma_f}{\sigma_{\rm obs}^2 + \sigma_f^2}
\right)^{1/2}.
中身を整理すると、
\frac{\sigma_f}{\sigma_{\rm obs}^2 + \sigma_f^2}
=
\frac{1}{\displaystyle \frac{\sigma_{\rm obs}^2}{\sigma_f} + \sigma_f }
と書き直せます。
ここで分母は二つの正の量の和であり、相加平均・相乗平均の関係より
\frac{\sigma_{\rm obs}^2}{\sigma_f} + \sigma_f \ge 2 \sigma_{\rm obs}
が成り立ちます。等号は
\boxed{\sigma_f = \sigma_{\rm obs}}
のときに達成されます。したがって、観測されたスペクトル幅(分解能と輝線幅の影響を含む)と同じ幅のガウスでフィルタすると S/N が最大化することがわかります。
ここで、
\sigma_{\rm obs}^2 = \sigma_{\rm true}^2 + \sigma_{\rm inst}^2
なので、細い輝線($\sigma_{\rm true} \ll \sigma_{\rm inst}$)の検出に対しては、装置の分解能 $\sigma_{\rm inst}$ をフィルタ幅として用いるのが統計的にも概ね妥当であることがわかります。
一方で、真の輝線が広い場合($\sigma_{\rm true} \gg \sigma_{\rm inst}$) には、より広いフィルタ幅($\sigma_{\rm obs}$程度)を選ぶ余地があります。とはいえ、そのためには事前に真の線幅を推定しなければならず、その推定には不確実性や人間のバイアスが入りやすいという実務上の難しさがあります。
その意味でも、装置分解能 ($\sigma_{\rm inst}$) をそのまま用いる matched filter は、統計的に合理的であるだけでなく、実務上も堅牢な選択肢であると思います。
まとめ
本記事で扱った matched filter の議論は、以下のように整理できます。
| 観点 | 結論 |
|---|---|
| 観測スペクトル | $N(x)=C+A\,G_{\rm obs}(x)$ |
| 観測線幅 | $\sigma_{\rm obs}^2=\sigma_{\rm true}^2+\sigma_{\rm inst}^2$ |
| 雑音モデル | 各ビンはポアソン統計:$\mathrm{Var}[N(x)] = C + A\,G_{\rm obs}(x)$ |
| 使用フィルタ | 正規化ガウス $f(x)$(幅 $\sigma_f$) |
| 最適化対象 | フィルタ後の検出 S/N |
| 弱線($C\gg A$)の最適幅 | $\boxed{\sigma_f=\sigma_{\rm obs}}$ |
| 細い輝線($\sigma_{\rm true}\ll\sigma_{\rm inst}$) | $\sigma_{\rm obs}\approx \sigma_{\rm inst}$ なので 分解能幅を使うのが最適 |
| 広い輝線($\sigma_{\rm true}\gg\sigma_{\rm inst}$) | $\sigma_f>\sigma_{\rm inst}$ も選択肢としてアリ?ただし 真の線幅推定が必要でバイアスに注意 |
| 実務的結論 | $\sigma_{\rm inst}$ を使う matched filter は 統計的にも実務的にもにも堅実な選択 |
今回の結果から、分解能幅を用いる matched filter は、単なる経験則ではなく理に適った手法であることが分かります。
実装面については、Inoue et al. による matched filter のコードが GitHub で公開されています:
Inoueらの実例を見ると、モンテカルロ評価なども組み合わせて検出有意性を評価しており、理論式だけでは整理しにくい側面があることも分かります。
本記事ではフィルタ幅と S/N の関係に焦点を当てた理論的整理を行いましたが、実際のデータ解析においては、このような理論的理解と実装を組み合わせて検証していくことが重要だと思います。