はじめに
スペクトル解析で「輝線を検出したい」とき、しばしば登場する手法が matched filter(マッチドフィルタ) です(e.g., Rutledge et al. 2003, Miyazaki et al. 2016, Inoue et al. 2025)。
よくある論文の説明では、
輝線を探すなら、スペクトルの分解能と同じ幅のガウスで畳み込むと信号雑音比(signal-noise ratio; S/N)が最大化する。
言われてみれば納得できそうですが、少し考えると疑問も湧きます。
- 本当に分解能と同じ幅が最適なのか?
- 明るさに依存しないのか?
- 真の輝線が有限な幅を持つ場合でも同じなのか?
筆者はいわゆるデコンボリュータであり、線幅は「観測器によって隠れているだけで、本来もっと細い」と統計的にバイアスされがちです。しかし、matched filter は 畳み込み(= ぼかし)を利用して検出する側の手法であり、デコンボリューションとは真逆の立場にあります。同じ観測データでも、扱う立場が変わるだけで見えるものが異なり、こうした “逆方向の視点” には、新鮮な世界が広がっていると思います。
そこで本記事では、デコンボリューションの視点を離れ、検出の観点だけから、どのフィルタ幅が S/N を最大にするのか を、シンプルな統計モデルに基づいて考察します。
1. 真のスペクトルと観測装置の分解能
まず、真のスペクトルを
S_{\rm true}(x) = C + A\,G_{\rm true}(x)
と書きます。
- $C$: 連続成分(簡単のため一様とする)
- $A$: 輝線の強度
- $G_{\rm true}(x)$: 真の輝線の形(ガウス幅 $\sigma_{\rm true}$ を持つとする)
観測装置はガウス応答 $R(x)$ を持つとします。分解能を $\sigma_{\rm inst}$ とすると、
R(x) = \frac{1}{\sqrt{2\pi}\sigma_{\rm inst}}
\exp\!\left(-\frac{x^2}{2\sigma_{\rm inst}^2}\right)
と書けます。
(分解能は厳密にはエネルギー依存性がありますが、ここでは簡略化します。)
観測されるスペクトル $N(x)$ は、真のスペクトル全体を応答関数で畳み込んだ形で表されます:
N(x) = (C + A\,G_{\rm true}) * R
ここで、定数の畳み込み $C * R = C$ を用いると、
N(x) = C + A\,(G_{\rm true} * R)(x)
となります。ガウス同士の畳み込みはガウスなので、
G_{\rm true} * R = G_{\rm obs}
と表すことにし、その幅は
\sigma_{\rm obs}^2 = \sigma_{\rm true}^2 + \sigma_{\rm inst}^2
となります。したがって、最終的に観測されるスペクトルは
N(x) = C + A\,G_{\rm obs}(x)
と書けます。つまり、この $N(x)$ がポアソン揺らぎを持って観測されます。
2. 検出に用いるフィルタ(正規化ガウス)
次に、検出に用いるフィルタ $f(x)$ を、正規化されたガウスとして
f(x) = \frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
と定義します。
ここでの目的はシンプルで、フィルタ幅 $σ_f$ をフリーパラメータとして、検出 S/N が最大になる $σ_f$ を求めることです。
(なお、実際の matched filter では領域を $\pm 3\sigma_f$ などに切って積分することがありますが、本記事では本質に集中するため、そのような細かい実装上の制約は考慮しないことにします。)
3. フィルタ後の信号 S(期待値)
フィルタをかけた後の「信号」の期待値は
S = \int A\,G_{\rm obs}(x)\,f(x)\,dx
となります。ここで
G_{\rm obs}(x) =
\frac{1}{\sqrt{2\pi}\sigma_{\rm obs}}
\exp\!\left(-\frac{x^2}{2\sigma_{\rm obs}^2}\right),
\qquad
f(x) =
\frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
はどちらも正規化されたガウスなので、分布の再生性より積分は、
S
= A \int G_{\rm obs}(x) f(x)\,dx
= A \frac{1}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}.
となります。
4. フィルタ後のノイズ
観測スペクトルの各ビンは互いに独立で、ポアソン分布に従うとします。このとき、ビンごとの分散は
\mathrm{Var}[N(x)] = C + A\,G_{\rm obs}(x)
となります。
フィルタ適用後の分散は、フィルタを重みとした加重平均になり、
\mathrm{Var}_{\rm filt}
= \int (C + A\,G_{\rm obs}(x))\, f(x)^2\,dx
= C\!\int f(x)^2 dx
+ A\!\int G_{\rm obs}(x) f(x)^2 dx
と分解できます。
ここで必要になる積分は 2 つです。
4.1 背景項
\int f(x)^2 dx
= \int
\left[
\frac{1}{\sqrt{2\pi}\sigma_f}
\exp\!\left(-\frac{x^2}{2\sigma_f^2}\right)
\right]^2
dx
= \frac{1}{2\sqrt{\pi}\sigma_f}.
4.2 輝線項
同様に、
\int G_{\rm obs}(x) f(x)^2 dx
= \int
\frac{1}{\sqrt{2\pi}\sigma_{\rm obs}}
e^{-x^2 / (2\sigma_{\rm obs}^2)}
\,
\frac{1}{(2\pi)\sigma_f^2}
e^{-x^2 / \sigma_f^2}
\,dx
をガウス積分として評価すると、
\int G_{\rm obs}(x) f(x)^2 dx
= \frac{1}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
となります。
したがって、フィルタ後の分散は
\mathrm{Var}_{\rm filt}
= \frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}.
ノイズの標準偏差は
\sigma_{\rm noise}
= \sqrt{\mathrm{Var}_{\rm filt}}
= \sqrt{
\frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
}.
5. 全体の S/N とその依存性
以上より、フィルタ後の信号雑音比は
\frac{S}{\sigma_{\rm noise}}
=
A \frac{1}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}
\left[
\frac{C}{2\sqrt{\pi}\,\sigma_f}
+ \frac{A}{2\pi\,\sigma_f\,\sqrt{\sigma_f^2 + 2\sigma_{\rm obs}^2}}
\right]^{-1/2}.
この式自体は複雑で見通しが悪く、厳密に最大値を解析的に求めるのは骨が折れます。
ただし、輝線サーチとして典型的に想定される 弱い輝線($C \gg A$)の場合には、
ノイズの式の第2項が無視できるため、
\frac{S}{\sigma_{\rm noise}}
\approx
\frac{A}{\sqrt{2\pi(\sigma_{\rm obs}^2 + \sigma_f^2)}}
\left(\frac{2\sqrt{\pi}\,\sigma_f}{C}\right)^{1/2}
\propto
\left(
\frac{\sigma_f}{\sigma_{\rm obs}^2 + \sigma_f^2}
\right)^{1/2}.
この簡単な形を最大化すると、
\boxed{\sigma_f = \sigma_{\rm obs}}
となり、観測されたスペクトル幅(分解能と輝線幅の影響を含む)と同じ幅のガウスでフィルタすると S/N が最大化することがわかります。
ここで、
\sigma_{\rm obs}^2 = \sigma_{\rm true}^2 + \sigma_{\rm inst}^2
なので、細い輝線($\sigma_{\rm true} \ll \sigma_{\rm inst}$)の検出に対しては、装置の分解能 $\sigma_{\rm inst}$ をフィルタ幅として用いるのが統計的にも概ね妥当であることがわかります。
一方で、真の輝線が広い場合($\sigma_{\rm true} \gg \sigma_{\rm inst}$) には、より広いフィルタ幅($\sigma_{\rm obs}$程度)を選ぶ余地があります。とはいえ、そのためには事前に真の線幅を推定しなければならず、その推定には不確実性や人間のバイアスが入りやすいという実務上の難しさがあります。
その意味でも、装置分解能 ($\sigma_{\rm inst}$) をそのまま用いる matched filter は、統計的に合理的であるだけでなく、実務上も堅牢な選択肢であると思います。
まとめ
本記事で扱った matched filter の議論は、以下のように整理できます。
| 観点 | 結論 |
|---|---|
| 観測スペクトル | $N(x)=C+A\,G_{\rm obs}(x)$ |
| 観測線幅 | $\sigma_{\rm obs}^2=\sigma_{\rm true}^2+\sigma_{\rm inst}^2$ |
| 雑音モデル | 各ビンはポアソン統計:$\mathrm{Var}[N(x)] = C + A\,G_{\rm obs}(x)$ |
| 使用フィルタ | 正規化ガウス $f(x)$(幅 $\sigma_f$) |
| 最適化対象 | フィルタ後の検出 S/N |
| 弱線($C\gg A$)の最適幅 | $\boxed{\sigma_f=\sigma_{\rm obs}}$ |
| 細い輝線($\sigma_{\rm true}\ll\sigma_{\rm inst}$) | $\sigma_{\rm obs}\approx \sigma_{\rm inst}$ なので 分解能幅を使うのが最適 |
| 広い輝線($\sigma_{\rm true}\gg\sigma_{\rm inst}$) | $\sigma_f>\sigma_{\rm inst}$ も選択肢としてアリ?ただし 真の線幅推定が必要でバイアスに注意 |
| 実務的結論 | $\sigma_{\rm inst}$ を使う matched filter は 統計的にも実務的にもにも堅実な選択 |
今回の結果を見ると、分解能幅を使う matched filter は、単なる経験則ではなく理に適った手法だということが分かります。
また、この手法は実務ではモンテカルロ評価と組み合わせることもあり、計算量が気になる場面もありますが、そこは将来の計算機に少し頑張ってもらうことにしてよいのかもしれません。