More than 1 year has passed since last update.

ChatGPTで日本語OCRをする(Code Interpreter)

Posted at 2023-08-08

はじめに

本記事ではChatGPT経由で日本語OCRをする方法について記述したものです。Code Interpreterを使うため、ChatGPT Plusに加入していることが前提条件となります。

Code Interpreterを使う

まず設定をONにして、Code Interpreterを使えるようにします。

Setting&Beta
Settings > Beta featuresからCode Interpreterをオンに

オンにすると、モデル選択欄にホバーしたときにCode Interpreterを選べるようになってます。

日本語OCR

まずはOCRが本当にできるのか試してみます。英語で実験。

成功しました。といっても、内部的にはpythonのコードを実行しているだけなので、pytesseractというOCRのライブラリの力になります。

では次は日本語も、といきたいところなのですが、デフォルトでは日本語のトレーニングデータが不足しており、このままでは実行できません。

「じゃあ、データを用意すればいいんだよね？」
というわけで、日本語のトレーニングデータを用意しましょう。以下のgithubページからダウンロードできます。
https://github.com/tesseract-ocr/tessdata/blob/main/jpn.traineddata
これを画像と同時に添付してやると、日本語OCRも可能になります。

おわりに

Code InterpreterでPythonのコードを実行できるのは結構嬉しい。後、ファイルの読み取りができるようになったから、クソ長プログラムを解析してほしいときにコピペいらずでファイル投下するだけでよくなったのが個人的には嬉しい。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up