Cooley-Tukey FFT

Last updated at 2025-03-23Posted at 2025-03-22

本題

配列長 $N$ の配列 $x$ があったとき、その DFT (離散フーリエ変換) の結果 $X$ は

\begin{aligned}
& X[k] =
  \sum_{n=0}^{N-1} x[n]
  \exp\left(-2\pi i \frac{n k}{N}\right) &
& (0 \le k < N) &
\end{aligned}

で定義される。
ここで $x$ の配列長 $N$ が 2 つの整数の積 $N = N_1 \times N_2$ で表せる時、 DFT は 2 つの DFT に分割して計算することができる。

上式に

\begin{aligned}
& N &=& N_1 \times N_2 & & & \\
& k &=& N_1 k_2 + k_1 &
& ( 0 \le k_1 < N_1, 0 \le k_2 < N_2 ) &
\end{aligned}

を代入して整理すると

\begin{aligned}
& X[k] &=&
  \sum_{n=0}^{N-1}
    x[n]
    \exp\left(-2\pi i \frac{n k}{N} \right) & \\
& &=&
  \sum_{n=0}^{N_1 N_2 - 1}
    x[n]
    \exp\left(-2\pi i \frac{n k}{N_1 N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{N_1-1}
      x[N_2 n_1 + n_2]
      \exp\left(-2\pi i \frac{(N_2 n_1 + n_2) k}{N_1 N_2} \right) & \\
\Leftrightarrow & X[N_1 k_2 + k_1] &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{N_1-1}
      x[N_2 n_1 + n_2]
      \exp\left(-2\pi i \frac{(N_2 n_1 + n_2) (N_1 k_2 + k_1)}{N_1 N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{N_1-1}
      \left(
        x[N_2 n_1 + n_2]
        \exp\left(-2\pi i \frac{n_2 k_1}{N_1 N_2} \right)
      \right)
      \exp\left(-2\pi i \frac{n_1 k_1}{N_1} \right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right)
    \exp(-2\pi i n_1 k_2 ) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{N_1-1}
      \left(
        x[N_2 n_1 + n_2]
        \exp\left(-2\pi i \frac{n_2 k_1}{N_1 N_2}\right)
      \right)
      \exp\left(-2\pi i \frac{n_1 k_1}{N_1} \right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
\end{aligned}

と式変形でき、よく見ると外側の DFT と内側の DFT に分割された形になっていることがわかる。

具体例

$X$ を偶数個目と奇数個目に分けて離散フーリエ変換する例を考えてみる。
上式に $N_1 = 2, k_1 = 0, 1$ を代入し整理してみると、

\begin{aligned}
& X[2 k_2 + 0] &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{2-1}
      \left(
        x[N_2 n_1 + n_2]
        \exp\left(-2\pi i \frac{0}{2 N_2}\right)
      \right)
      \exp\left(-2\pi i \frac{0}{N_1} \right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \left(
      \sum_{n_1=0}^{2-1}
        x[N_2 n_1 + n_2]
    \right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    (x[n_2] + x[N_2 + n_2])
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& X[2 k_2 + 1] &=&
  \sum_{n_2=0}^{N_2-1}
    \sum_{n_1=0}^{2-1}
      \left(
        x[N_2 n_1 + n_2]
        \exp\left(-2\pi i \frac{n_2}{2 N_2}\right)
      \right)
      \exp\left(-2\pi i \frac{n_1}{2} \right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \left(
      \sum_{n_1=0}^{2-1}
        \left(
          x[N_2 n_1 + n_2]
        \right)
        \exp\left(-2\pi i \frac{n_1}{2} \right)
    \right)
    \exp\left(-2\pi i \frac{n_2}{2 N_2}\right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \left(
      x[n_2] \exp(0) +
      x[N_2 + n_2] \exp(-\pi i)
    \right)
    \exp\left(-2\pi i \frac{n_2}{2 N_2}\right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
& &=&
  \sum_{n_2=0}^{N_2-1}
    \left(
      x[n_2] -
      x[N_2 + n_2]
    \right)
    \exp\left(-2\pi i \frac{n_2}{2 N_2}\right)
    \exp\left(-2\pi i \frac{n_2 k_2}{N_2} \right) & \\
\end{aligned}

となり、配列長 $N$ の DFT が配列長 $N/2$ の DFT 2 回分に分割することができた。
この操作をグラフにすると、かの有名なバタフライ演算の図となる。

                                                                                  ___
x[0] --+-(+)---------------------------------------------------------------------|   |-> X[0]
       |  ^                                                                      | D |
x[1] --|--|------------+-(+)-----------------------------------------------------|   |-> X[2]
       +-----------+   |  ^                                                      | F |
x[2] -----|--------|---|--|------------+-(+)-------------------------------------|   |-> X[4]
          |        |   +-----------+   |  ^                                      | T |
x[3] -----|--------|------|--------|---|--|------------+-(+)---------------------|___|-> X[6]
          |        v      |        |   +-----------+   |  ^                       ___
x[4] -----+-(*-1)-(+)-----|--------|------|--------|---|--|------------(*W_8^0)--|   |-> X[1]
                          |        v      |        |   +-----------+             | D |
x[5] ---------------------+-(*-1)-(+)-----|--------|------|--------|---(*W_8^1)--|   |-> X[3]
                                          |        v      |        |             | F |
x[6] -------------------------------------+-(*-1)-(+)-----|--------|---(*W_8^2)--|   |-> X[5]
                                                          |        v             | T |
x[7] -----------------------------------------------------+-(*-1)-(+)--(*W_8^3)--|___|-> X[7]

以上の分割操作を繰り返すことにより DFT の計算量を $O(N^2)$ から $O(N \log N)$ に減らすことができる。

サンプルコード

最後にサンプルコードを示す。
このコードは 0BSD ライセンス (出典明記不要で自由に利用可能) の元に公開する。

playground

fn main() {
    // DFT と Cooley-Tukey FFT の計算時間を比較
    println!("len\tdft (sec)\tfft_cooley_tukey (sec)");
    let mut rand = random();
    let len_patterns: Vec<usize> = (0..=10).map(|x| 1 << x).collect();
    for len in len_patterns {
        let x: Vec<(f64, f64)> = (0..len).map(|_| (rand(), rand())).collect();

        let start = std::time::Instant::now();
        let y1 = dft(&x, false);
        let dft_dur = start.elapsed().as_secs_f64();

        let start = std::time::Instant::now();
        let y2 = fft_cooley_tukey(&x, false);
        let cooley_tukey_dur = start.elapsed().as_secs_f64();

        std::hint::black_box((y1, y2));
        println!("{}\t{:.9}\t{:.9}", len, dft_dur, cooley_tukey_dur);
    }
}

fn dft(x: &Vec<(f64, f64)>, inverse: bool) -> Vec<(f64, f64)> {
    // 事前に w を計算しておく
    let sign = if inverse { 1.0 } else { -1.0 };
    let w: Vec<(f64, f64)> = (0..x.len())
        .map(|n| {
            let theta = sign * std::f64::consts::TAU * n as f64 / x.len() as f64;
            (theta.cos(), theta.sin())
        })
        .collect();

    // DFT
    let mut y = vec![(0f64, 0f64); x.len()];
    for k in 0..y.len() {
        for n in 0..x.len() {
            let w_nk = w[(n * k) % w.len()];
            y[k].0 += x[n].0 * w_nk.0 - x[n].1 * w_nk.1;
            y[k].1 += x[n].0 * w_nk.1 + x[n].1 * w_nk.0;
        }
        if inverse {
            y[k].0 /= y.len() as f64;
            y[k].1 /= y.len() as f64;
        }
    }

    return y;
}

fn fft_cooley_tukey(x: &Vec<(f64, f64)>, inverse: bool) -> Vec<(f64, f64)> {
    // 事前に w を計算しておく
    let sign = if inverse { 1.0 } else { -1.0 };
    let w: Vec<(f64, f64)> = (0..x.len())
        .map(|n| {
            let theta = sign * std::f64::consts::TAU * n as f64 / x.len() as f64;
            (theta.cos(), theta.sin())
        })
        .collect();

    // 出力用 (y1 と y2 を交互に使い回す)
    let mut y1 = x.clone();
    let mut y2 = vec![(0f64, 0f64); x.len()];

    // FFT
    let mut len = y1.len();
    let mut stride = 1;
    while len >= 2 {
        // len を 2 つの整数の積に分解
        let len1 = (2..len).find(|&n| len % n == 0).unwrap_or(len);
        let len2 = len / len1;

        // バタフライ演算
        y2.iter_mut().for_each(|y| *y = (0.0, 0.0));
        for k1 in 0..len1 {
            for n1 in 0..len1 {
                for n2 in 0..len2 {
                    let k = len1 * n2 + k1;
                    let n = len2 * n1 + n2;
                    let w = w[(stride * n * k1) % w.len()];
                    for offset in 0..stride {
                        let k = stride * k + offset;
                        let n = stride * n + offset;
                        y2[k].0 += y1[n].0 * w.0 - y1[n].1 * w.1;
                        y2[k].1 += y1[n].0 * w.1 + y1[n].1 * w.0;
                    }
                }
            }
        }

        // y1 と y2 を入れ替えて次のステップへ
        std::mem::swap(&mut y1, &mut y2);
        len = len2;
        stride *= len1;
    }

    // 逆変換の場合は正規化
    if inverse {
        for k in 0..y1.len() {
            y1[k].0 /= y1.len() as f64;
            y1[k].1 /= y1.len() as f64;
        }
    }

    return y1;
}

// 疑似乱数生成 (xorshift32)
fn random() -> impl FnMut() -> f64 {
    let mut state = 1u32;
    move || {
        state ^= state << 13;
        state ^= state >> 17;
        state ^= state << 5;
        return (state - 1) as f64 / std::u32::MAX as f64;
    }
}

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn test_dft() {
        // 1 Hz の正弦波を用意
        let x: Vec<(f64, f64)> = (0..8)
            .map(|n| std::f64::consts::TAU * n as f64 / 8.0)
            .map(|n| (n.cos(), n.sin()))
            .collect();

        // 期待する DFT の結果
        let expect_fft: Vec<(f64, f64)> = vec![0.0, 8.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
            .into_iter()
            .map(|n| (n, 0.0))
            .collect();

        // DFT
        let actual_fft = dft(&x, false);
        assert_eq!(actual_fft.len(), expect_fft.len());
        for (a, b) in expect_fft.iter().zip(actual_fft.iter()) {
            assert!((a.0 - b.0).abs() < 1e-10, "{} != {}", a.0, b.0);
            assert!((a.1 - b.1).abs() < 1e-10, "{} != {}", a.1, b.1);
        }

        // iDFT
        let actual_ifft = dft(&actual_fft, true);
        assert_eq!(actual_ifft.len(), x.len());
        for (a, b) in x.iter().zip(actual_ifft.iter()) {
            assert!((a.0 - b.0).abs() < 1e-10, "{} != {}", a.0, b.0);
            assert!((a.1 - b.1).abs() < 1e-10, "{} != {}", a.1, b.1);
        }
    }

    #[test]
    fn test_fft() {
        // 乱数列を用意
        let mut rand = random();
        let len = 2 * 3 * 5 * 7;
        let x: Vec<(f64, f64)> = (0..len).map(|_| (rand(), rand())).collect();

        // FFT の結果が DFT と一致することを確認する
        let expect_fft = dft(&x, false);

        // FFT
        let actual_fft = fft_cooley_tukey(&x, false);
        assert_eq!(actual_fft.len(), expect_fft.len());
        for (a, b) in expect_fft.iter().zip(actual_fft.iter()) {
            assert!((a.0 - b.0).abs() < 1e-10, "{} != {}", a.0, b.0);
            assert!((a.1 - b.1).abs() < 1e-10, "{} != {}", a.1, b.1);
        }

        // iFFT
        let actual_ifft = fft_cooley_tukey(&actual_fft, true);
        assert_eq!(actual_ifft.len(), x.len());
        for (a, b) in x.iter().zip(actual_ifft.iter()) {
            assert!((a.0 - b.0).abs() < 1e-10, "{} != {}", a.0, b.0);
            assert!((a.1 - b.1).abs() < 1e-10, "{} != {}", a.1, b.1);
        }
    }

    #[test]
    fn test_random() {
        let mut rand = random();
        for _ in 0..9999 {
            rand();
        }
        assert_eq!(rand(), 1799336687.0 / std::u32::MAX as f64);
    }
}

参考

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Cooley-Tukey FFT

目次

本題

具体例

サンプルコード

参考