前置き
画像処理を勉強しようとすると、OpenCVなど特定のライブラリの使い方の説明が密接に絡んでおり、知りたい情報のノイズになることがある
逆に、説明が深すぎて目が滑る場合も多い
キーワードとその関連がわかれば、あとは自力で掘り下げていけるのだが、初学者にとってはそこのハードルが高いように思えたので、サポートできる(かもしれない)情報をまとめてみた
画像処理
画像を表示する処理全般を指す
それだけならば単純なようだが、オリジナルデータを単純に表示する他、画像に色なりフィルターなりの効果を与えたり、表示位置や表示サイズを任意で変更しようとすると、数学的知識が必要になってくる
フォーマット
最近ではpngやjpegが一般的だが、実際は多くの形式が存在する
一例を記載する
PNG
特徴: 可逆圧縮(画質を劣化させずに圧縮)を使用
用途: 背景が透明な画像やアイコン、イラストなど
メリット: 透明性をサポートし、画質が劣化しない
デメリット: ファイルサイズが大きくなる場合がある
ISO/IEC 15948:2004
ウイキペディア Portable Network Graphics
PNG
The Definitive Guid
JPEG
特徴: 非可逆圧縮(画質を劣化させて圧縮)
用途: 写真やリアルな画像を保存するのに適している
メリット: 圧縮率が高く、ファイルサイズを小さくできる
デメリット: 圧縮によって画質が劣化する
JPEG公式サイト
ウイキペディア JPEG
W3C Overview of JPEG
BMP
特徴: 圧縮を行わない画像フォーマット。
用途: シンプルな画像の保存、レトロな用途(基本的な画像形式)。
メリット: 画質が劣化しない(無圧縮)。
デメリット: ファイルサイズが非常に大きい。
ウイキペディア Windows bitmap
ウイキペディア ビットマップ画像
TIFF
特徴: 可逆圧縮または無圧縮を選択できる。
用途: 印刷や高品質の画像保存。
メリット: 高品質な画像保存が可能で、可逆圧縮に対応。
デメリット: ファイルサイズが大きく、一般的な用途には重い。
ウイキペディア Tagged Image File Format
ピクセル (Pixel)
説明: 画像を構成する最小単位の「点」。
イメージ: 画像は無数の小さな四角い色の点(ピクセル)の集まりでできている。
解像度 (Resolution)
説明: 画像の細かさや鮮明さを表す指標。通常、ピクセル数で表される(例:300dpiや1920x1080)。
イメージ: 解像度が高いほど、より多くのピクセルが詰め込まれており、滑らかな画像になる。
ラスター画像
説明: ラスター画像は、小さな色の点(ピクセル)の集まりで表現された画像のこと。
仕組み: 画像全体がグリッド(格子状)のピクセルで構成され、それぞれのピクセルに色が割り当てられている。
イメージ: モザイク画のように、細かい点が集まって1つの画像を作るイメージ。
パス図形
説明: 点とそれを結ぶ線(直線や曲線)で構成された図形。ピクセルではなく、数学的な座標で形状を定義する。
イメージ:ロゴ、アイコン、フォント、イラストなどのデザイン。
画像操作
画像のサイズ変更(リサイズ)
説明: 画像の「縦」と「横」のピクセル数を変更する操作。バイリニア補間やランチョス補間などの手法を用いる
用途: 画像を大きくしたり、小さくしたりして画面や用途に合わせる。
トリミング(切り抜き)
説明: 画像の一部だけを残して、不要な部分を取り除く操作。
用途: 必要な部分だけを強調したり、画面に収める。
回転と反転(フリップ)
説明:画像を90度、180度、左右または上下に鏡写しのように反転する操作。座標変換(回転行列)やアフィン変換などの手法を用いる
用途:画像の向きを変更する
カラースケールの変換
説明: 画像の色の表現方法を変える操作。主にカラー画像を白黒(グレースケール)に変換することが多い。平均値法、RGB → HSV変換、二値化など。
用途:特定の色の強調や分析。画像処理アルゴリズムの前処理。
クリッピング
説明: 画像や図形の一部を切り取って表示する操作。指定した領域の外側を無視して内側だけを残すこと。Sutherland-Cohenアルゴリズム、Weiler-Athertonアルゴリズムなど。
用途:写真の特定の部分だけを表示する。
透明度
説明: 画像や図形がどれだけ「透けて見えるか」を表す性質。アルファブレンディング、プレマルチプライドアルファ。
用途:写真やデザインでの重ね合わせ。
フィルタリングと特徴抽出
平均値フィルタ
説明: 画像の各ピクセルを、周囲のピクセル値の平均値で置き換えるフィルタ。
用途:ノイズを平滑化して画像をぼかす効果がある
ガウシアンフィルタ
説明: ガウス分布(山型の曲線)に基づいて重みをつけて周囲のピクセルを平均化するフィルタ。
用途:平均値フィルタよりも自然なぼかし効果
メディアンフィルタ
説明: 周囲のピクセル値の中央値を計算し、それをピクセル値に置き換えるフィルタ。
用途:ノイズ(特に塩胡椒ノイズ)を効果的に除去