1. 研究背景
従来の画像復元手法では、CNNを用いた直接的な特徴抽出が主流である。しかし、微細なノイズや局所的なパターンは通常の入力空間では十分に強調されず、復元学習が困難になる場合がある。
本研究では、入力画像を超球体空間に変換することで、微細ノイズを相対的に増幅し、復元精度の向上を目指した。
2. 手法
入力前処理:
CelebAデータセットから50,000枚の顔画像を取得。
画像サイズを64×64にリサイズ。
ノイズは正規分布N(0,0.05²)に従い加算。
モデル構成:
超球体CNN (Encoder):
入力画像をFFTで実部・虚部に分解。
2×チャンネルに結合後、3層の畳み込み層+バッチ正規化で特徴抽出。
最終的に256次元の正規化特徴ベクトルに変換。
CNNDecoder (Decoder):
256次元特徴ベクトルを全結合層で4×4×512に変換。
4段階の逆畳み込み層で64×64×3のRGB画像を復元。
学習条件:
損失関数: MSELoss
最適化: Adam
エポック数: 32
バッチサイズ: 1(メモリ制約
3. 実験結果
推論評価(ノイズ画像→復元画像→正解画像比較):
MSE: 0.014~0.031
PSNR: 14~20 dB
SSIM: 0.27~0.72
超球体特徴空間を経由することで、微細なノイズでも学習可能となり、復元画像の顔特徴保持性が向上。
同条件での通常CNNと比較して、SSIMの中央値は約0.5以上であり、構造的類似性の保持に優れることを確認。
4. 考察
超球体変換により小さなノイズや微細構造が相対的に強調され、Encoderがノイズ情報を効果的に取り込める。
復元結果はノイズの影響を低減し、元画像の顔特徴を保持できていることが定量評価(MSE、PSNR、SSIM)から確認された。
バッチサイズ1でも学習は安定しており、超球体CNNによる超球体表現が復元タスクに有効であることを示唆。
5. 結論
超球体CNNを用いた特徴抽出は、顔画像の微細ノイズ復元において従来のCNNよりも優れた性能を示した。
今後は、データ拡張や異なるノイズタイプへの対応、バッチサイズ増加による学習安定化などを検討することで、さらに精度向上が期待される。