本記事でできること
画像を明るさの情報をもとに2値化します。
想定シーン
ロボットをビジュアルフィードバック制御する
カメラを使ったロボットアームの制御方法を、ビジュアルフィードバック制御といいます。ここでは、ビジュアルフィードバック制御を使った自動化システムを開発する際に必要となる画像認識プログラムをまとめています。
画像を2値化する
画像処理の中でも、2値化はもっともよく使うアルゴリズムのひとつです。ここでは、画像内の明るさに基づいて領域を分割する2値化のプログラムを掲載します。
実行環境
- OS:Ubuntu 22.04 LTS
- 言語:C++
- クルーボ:v5.1.0
クルーボについて
ロボットアプリケーション開発には、株式会社チトセロボティクスのロボット制御ソフトウェア「クルーボ」を使用します。本記事のプログラムは、クルーボがインストールされた制御コンピュータ上で動作します。
- クルーボの製品サイト:https://chitose-robotics.com/product
プログラム抜粋
cv::Mat binary(const cv::Mat& image, const int threthold) {
cv::Mat image_gray = convert_grayscale(image);
cv::Mat binary_image;
if (threthold == 0) {
threshold(image_gray, binary_image, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);
} else {
threshold(image_gray, binary_image, threthold, 255, cv::THRESH_BINARY);
}
return binary_image;
}
2値化の閾値(threthold)を0にした場合には、大津の2値化が適用されます。大津の2値化はアルゴリズムによって、閾値を自動設定します。
全体プログラム
#include <iostream>
#include <opencv2/opencv.hpp>
cv::Mat load_image(const std::string file_path) {
cv::Mat loaded_image = cv::imread(file_path, 1);
if (loaded_image.empty()) {
throw std::runtime_error("画像を正常に読み込めませんでした。");
}
return loaded_image;
}
cv::Mat convert_grayscale(const cv::Mat& image) {
const int grayscale_channel_num = 1;
if (image.channels() == grayscale_channel_num) {
return image.clone();
}
cv::Mat gray_image;
cvtColor(image, gray_image, cv::COLOR_BGR2GRAY);
return gray_image;
}
cv::Mat binary(const cv::Mat& image, const int threthold) {
cv::Mat image_gray = convert_grayscale(image);
cv::Mat binary_image;
if (threthold == 0) {
threshold(image_gray, binary_image, 0, 255, cv::THRESH_BINARY | cv::THRESH_OTSU);
} else {
threshold(image_gray, binary_image, threthold, 255, cv::THRESH_BINARY);
}
return binary_image;
}
int main(void) {
std::string file_path = "../data/green_sample.jpg";
const cv::Mat loaded_image = load_image(file_path);
const int threthold = 180;
const cv::Mat binary_image = binary(loaded_image, threthold);
cv::imshow("window", binary_image);
cv::waitKey(0);
}
おわりに
人手作業をロボットアームで自動化するために、カメラを使ったロボット制御=ビジュアルフィードバック制御が大切です。
ロボット制御用の画像認識でも中身のひとつひとつはシンプルなので、要素に分解して解説していきたいと思います。