はじめに
本記事ではChatGPT経由で日本語OCRをする方法について記述したものです。Code Interpreterを使うため、ChatGPT Plusに加入していることが前提条件となります。
Code Interpreterを使う
まず設定をONにして、Code Interpreterを使えるようにします。
- Setting&Beta
- Settings > Beta featuresからCode Interpreterをオンに
オンにすると、モデル選択欄にホバーしたときにCode Interpreterを選べるようになってます。
日本語OCR
まずはOCRが本当にできるのか試してみます。英語で実験。
成功しました。といっても、内部的にはpythonのコードを実行しているだけなので、pytesseractというOCRのライブラリの力になります。
では次は日本語も、といきたいところなのですが、デフォルトでは日本語のトレーニングデータが不足しており、このままでは実行できません。
「じゃあ、データを用意すればいいんだよね?」
というわけで、日本語のトレーニングデータを用意しましょう。以下のgithubページからダウンロードできます。
https://github.com/tesseract-ocr/tessdata/blob/main/jpn.traineddata
これを画像と同時に添付してやると、日本語OCRも可能になります。
おわりに
Code InterpreterでPythonのコードを実行できるのは結構嬉しい。後、ファイルの読み取りができるようになったから、クソ長プログラムを解析してほしいときにコピペいらずでファイル投下するだけでよくなったのが個人的には嬉しい。