More than 1 year has passed since last update.

claude 3で貸借対照表PDFを表形式に変換してみた。

Last updated at 2024-03-21Posted at 2024-03-21

経緯

前回GPTsで貸借対照表PDFを表形式に変換してみた。という決算書の内財務諸表PDFをAIに読み取らせ、データ化する記事を投稿した。そこでは画像形式PDFには対応していなかったことや、一部形式が変わるとエラーで落ちる。表の形式は変わらないのに色付きになると急に精度が落ちるなどまだまだ改善が必要だった。そこで最近噂のclaude 3で同じことをするとどうなるか試してみた。

結果

結論から言うと現時点のGPT4よりはるかに精度が良く上記問題点を解決した出力結果を得られた。以下に解決した点とclaude3が勝っている点について記載する。

解決した点

画像形式を読み取れるようになった。
エラーで落ちることがなくなった。
精度が向上した。

改善点

プロンプトが格段に短くなった。
テキストPDFの場合、ファイル丸ごとアップロードし、そこから目的の情報を抽出できるようになった。

まとめ

GPTsで1~2ヶ月ほど調整を行いながら開発をしていたが、その時間が一瞬で無に帰すレベルでAIの精度が向上していた。
GPT-5もおそらく同じレベルにまで到達するような気はするが、現状OCRの処理を行う場合は圧倒的にclaude3の方が有用であるといえる。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up