CUDA
borgWarp
#migrated

Paper > CUDA > OpenMP-CUDA implementation of the moment method and multilevel fast multipole algorithm on multi-GPU computing systems by Jian Guan (2013)

CUDAを用いた電磁波散乱計算の高速化。
https://www.ideals.illinois.edu/handle/2142/44803

GPUを用いた正当進化の研究。

対象手法

  • MoM: method of moments
    • CUDA版: OpenMP-CUDA-MoM
  • MLFMA: multilevel fast multipole algorithm
    • CUDA版: OpenMP-CUDA-MLFMA

計算結果

  • RCS: radar cross section

結果のハイライト

  • Figure 4.3 (p25), Figure 4.5 (p26), and Figure 4.6 (p27)
    • CPU版とCUDA版の結果(RCS)の比較
      • 一致している
  • Tables 4.1から4.6
    • CPU版とCUDA版の計算効率の比較 (MoM)
      • 30倍以上高速化している
    • EFIE: electric-field integral equation (Eq. 2.1)
    • MFIE: magnetic-field integral equation (Eq. 2.2)
    • CFIE: combined-field integral equation (Eq. 2.5)
  • Figure 5.4 (p40), Figure 5.5 (p41), and Figure 5.6 (p42)
    • CPU版とCUDA版の結果(RCS)の比較
      • 一致している
  • Figure 5.7 (p43)とFigure 5.8 (p44)
    • unknownsの数と効率化の関係
      • System Matrix Assembly
      • Calculation of Vs and Vf
      • BiCGstab Iterative Solver
  • Tables 5.1から5.4 (p46とp47)
    • 以下の項目の計算効率の改善度
      • Calculation of Vs and Vf
      • Calculation of T
      • Assembly of Z_{near}
      • BiCGStab Solution
      • Total Computation
    • 20倍以上になっている

計算の中身を熟知している人によるGPU高速化のため、しっかり高速化している印象を受ける。