「プログラミング フリー画像」で検索するとヒットする画像。こんなの↓
や、Amazonにあるこんな服↓
に書いてあるコードを読み取りテキスト化するアプリを作成してみました。
30分程でざっと作成したので精度は粗いです。
勇者は精度を高めるようなコントリビュートをお願いします。
敬具
構成
言語:Python3.11.3
仮想環境:venv
ディレクトリ構成は下記の通り
text_reading_app/
├ image
│ └ clothes.py
app.py
pyvenv.cfg
README.md
・app.py
メインのアプリケーション。
画像を読み取り、テキストを抽出する。
OpenCVで画像を読み取り、Tesseract OCRで画像からテキストを抽出する。
・image/
画像のディレクトリ
環境構築
仮想環境を作成します
python -m venv .
仮想環境を有効化します
source bin/activate
必要なライブラリをインストールします
pip install opencv-python tesseract
コード
app.py
import cv2
import pytesseract
def reading_image(image_path):
# 画像を読み込む
image = cv2.imread(image_path)
# 画像をグレースケールに変換する
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# ノイズを軽減するために画像をぼかす
blurred = cv2.GaussianBlur(gray, (3, 3), 0)
# 画像からテキストを抽出する
text = pytesseract.image_to_string(blurred, lang='eng')
return text
# 画像からテキストを抽出する
image_path = 'image/clothes.jpeg'
text = reading_image(image_path)
print(text)
GitHubに挙げています