1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

超球体CNNを用いた顔画像ノイズ復元の研究(1)

Last updated at Posted at 2025-09-10

1. 研究背景

従来の画像復元手法では、CNNを用いた直接的な特徴抽出が主流である。しかし、微細なノイズや局所的なパターンは通常の入力空間では十分に強調されず、復元学習が困難になる場合がある。
本研究では、入力画像を超球体空間に変換することで、微細ノイズを相対的に増幅し、復元精度の向上を目指した。

2. 手法

入力前処理:

CelebAデータセットから50,000枚の顔画像を取得。

画像サイズを64×64にリサイズ。

ノイズは正規分布N(0,0.05²)に従い加算。

モデル構成:

超球体CNN (Encoder):

入力画像をFFTで実部・虚部に分解。

2×チャンネルに結合後、3層の畳み込み層+バッチ正規化で特徴抽出。

最終的に256次元の正規化特徴ベクトルに変換。

CNNDecoder (Decoder):

256次元特徴ベクトルを全結合層で4×4×512に変換。

4段階の逆畳み込み層で64×64×3のRGB画像を復元。

学習条件:

損失関数: MSELoss

最適化: Adam

エポック数: 32

バッチサイズ: 1(メモリ制約

3. 実験結果

推論評価(ノイズ画像→復元画像→正解画像比較):

Figure_1aa.png

Figure_1bb.png

Figure_1dd.png

MSE: 0.014~0.031

PSNR: 14~20 dB

SSIM: 0.27~0.72

超球体特徴空間を経由することで、微細なノイズでも学習可能となり、復元画像の顔特徴保持性が向上。

同条件での通常CNNと比較して、SSIMの中央値は約0.5以上であり、構造的類似性の保持に優れることを確認。

4. 考察

超球体変換により小さなノイズや微細構造が相対的に強調され、Encoderがノイズ情報を効果的に取り込める。

復元結果はノイズの影響を低減し、元画像の顔特徴を保持できていることが定量評価(MSE、PSNR、SSIM)から確認された。

バッチサイズ1でも学習は安定しており、超球体CNNによる超球体表現が復元タスクに有効であることを示唆。

5. 結論

超球体CNNを用いた特徴抽出は、顔画像の微細ノイズ復元において従来のCNNよりも優れた性能を示した。
今後は、データ拡張や異なるノイズタイプへの対応、バッチサイズ増加による学習安定化などを検討することで、さらに精度向上が期待される。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?