どうも、カーブミラーです。
今回は、OCRしてみます。
本記事は、ChatGPT(有料版)
で行なっております。画像は
あります。 あしからず。
ニュースはないので、
さっそく本題です。
今回は、
OpenCVでOCRしてみます。
OCRとは
なんでしょうか?
user
質問。OCRとはなんですか?
ChatGPT
OCR(Optical Character Recognition、光学文字認識)とは、画像やスキャンしたドキュメントなどに含まれる文字を、コンピュータが認識し、テキストデータとして変換する技術のことです。例えば、印刷された書類や手書きのメモをスキャンして、その内容をデジタルテキストとして編集したり検索したりできるようにするのに使われます。
具体的には、OCR技術は画像内の文字の形状を解析し、対応するテキストを認識します。これにより、紙媒体の資料や画像化された情報を、コンピュータ上で扱いやすいテキストデータに変換できるようになります。
OCRは、書籍のデジタル化、名刺の管理、自動データ入力など、さまざまな分野で活用されています。
簡単に言うと
画像や写真に写っている文字を
コンピュータが読み取って、
デジタルの文字に
変える技術のことです。
大量の文書(書籍など)があり、
デジタル化しなければ
ならない場合に
よく使われます。
一時期、「自炊」と呼ばれる、
書籍を裁断し、
スキャナーを使って
デジタルデータに
変換する行為が
流行りましたね。
そこで使われた
技術になります。
さっそくやってみましょう。
今回は、
スマホの画面を
スクショで取得して
行ないます。
まずは
英文です。
Promptはこちら。
OpenCVで、OCRしてください。
画像をアップロードして
Promptを送信します。
なんの問題もなく
OCRできました。
ここで
ひとつ注意を。
OCRできたとしても
確実に、完璧に、
行なえるわけでは
ありません。
必ず確認してくださいね。
では次に日本語文章です。
同じPromptを使いました。
すると
ChatGPT
現在の環境では日本語のOCRが利用できないため、テキストの抽出ができませんでした。代わりに、手動で内容を確認して入力いただくか、別の方法でテキストを抽出することをお勧めします。他にお手伝いできることがあればお知らせください。
と出てきました。
そうです。
OpenCVでは、
日本語文章のOCRは
できないのです。
では、
OCRできないのか?
そんなことは
ありません。
“Code Interpreterを使う”という
目的にはそぐいませんが
日本語文章のOCRも
できます。
画像をアップロードしたら
OCRしてください。
と入力して送信してください。
これは
Code Interpreterではなく、
ChatGPT自体が
処理を担当します。
ChatGPTには
GPT-4Visionという
ビジュアルを認識できる
能力があるのです。
それで
日本語も認識できる
わけです。
それでも
完璧ではありませんので、
内容は必ず確認してください。
絵文字なんかは
認識が甘いのか
近くはあるけれど、
間違ったものを
出してきますので。
それから
本格的に「自炊」する場合は
ChatGPTでは時間が掛かります。
専用のシステムの
利用をおすすめします。
最後に
同じ日本語文章でも
手書き文字がありますよね。
これは
OCRが難しいと
されるものです。
ChatGPT
以下の内容が画像から読み取れました。
8月のおすすめフード
- 枝豆つかみ取り 440円
- ひんやりナスの揚げびたし 440円
- みょうがの豚肉巻き揚げ 660円
- チキンとグレープフルーツのサラダ仕立て 770円
- イワシのスパニッシュオムレツ 770円
- ゴーヤとツナの全粒塩レモンパスタ
- S 715円
- M 935円
- L 1045円
このような内容です。
さすがです😸
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。