9
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【HULFT Square】Claude Sonnet 4.5を使って請求書のAIOCRを作りたい

Last updated at Posted at 2025-12-16

こんな作業していませんか?

受領したPDF形式の請求書



まず「ワードで開いて



次に「Excelにコピー」して



そして「別シートにExcel関数を使用して必要な部分だけ抽出」して



会計システムと突合する用の入金消込用Excelを作られている。

とかとか。。。
↓の業務イメージ
画像1.png

今回は
Excel作成(実際に作成したのはCSV)までを
ClaudeとHULFT Squareを使用して作りたいな~
というお話。

実現イメージ詳細

【前提】

  • BedrockにてAPIキーを発行しておく
  • PDFファイルをHULFT Squareストレージへアップロード

【処理内容ざっくり】

画像2.png

~~~突然出てきたHULFT Squareとは???~~~

詳細はこちら

ファイル連携方法について
HULFT SquareはHULFT通信、FTP(SFTP)サーバ機能、
APIサーバ(APIマネジメント)機能がある為、手動アップロード以外にもファイル連携方法があります。

【処理内容もう少し細かく】

  1. PDFファイルをAIへ渡すためにバイナリ形式へ変換(下図内青枠)
  2. Converse APIでClaudeをコールしMarkDownとして出力(下図内赤枠)
  3. 再度Claudeをコールし、必要なデータのみCSVとして出力

下図のワークフロー(スクリプト)がHULFT Squareの開発画面。
画像3.png

Converse APIについて
過去にこちらで勉強させていただきました。

【Converse API呼び出しについて】

サンプルはこんな感じ

【PDFデータをMarkdown変換する際のリクエストスキーマ】

{
 "modelId": "us.anthropic.claude-sonnet-4-5-20250929-v1:0",
 "system": [
   {
     "text": "あなたは優秀な経理担当者です。"
   }
 ],
 "messages": [
   {
     "role": "user",
     "content": [
       {
         "text": "PDFの内容をMarkdown形式に変換して出力してください。"
       },
      {
         "document": {
                "format": "pdf",
                "name": "document",
                "source": {
                "bytes": "..."
                 }
          }
       }
     ]
   }
 ],
 "inferenceConfig": {
   "maxTokens": 4096,
   "temperature": 0.1
 }
}

ドキュメントをリクエストに含まない場合
「 "document":{} 」部分を無くせばOKです。

HULFT Squareユーザ向け
リクエスト時(マッピング:input)で指定している型は
余裕があるときに追記します。。。
ご要望あればお願いします。

【リクエストのサンプルプロンプト】

#依頼
PDFの内容をMarkdown形式に変換して出力してください。
出力時は請求書部分の以下 #出力形式 に沿い出力してください。
また #出力時注意事項 にも沿って出力してください。

#出力形式
以下出力形式に沿い出力してください。

# 御請求書
## 基本情報
- 御請求日
- 支払期限
- 合計金額
- 御請求日
## 振込先
- 銀行名
- 口座種別
- 口座番号
- 口座名義
## 請求先情報
- 請求先会社名
## 請求元情報
- 請求元会社名
- 請求元会社名住所
- 登録番号
## 請求内容と金額

#出力時注意事項
- 請求書Noは出力する。
- "*"で強調表示をしない。
- \nを出力しない。

出力結果

インプットのPDF

image (1).png

Markdown化

# 請求書
## HULFT Square御請求書
株式会社 ABCDEFJ

---
請求日: 2025年12月15日
請求書番号: 11922960
顧客 ID: 304304
登録番号: T5656X5656

---
宛先:
営業本部  
株式会社セゾンテクノロジー  
〒107-0052  
東京都港区赤坂1-8-1 赤坂インターシティAIR 19F
---

銀行名: 1070052銀行  
口座種別: 普通  
口座番号: 1234567890  
口座名義: カ)セゾンテクノロジー  
支払い期日: 2025-12-31

---
## ご請求内容
| 数量 | ご請求内容 | 単価 | 行の合計 |
|------|-----------|------|----------|
| 1 | HULFT Square Starterプラン | 240,000 | 240,000 |

---

小計: 240,000¥
消費税: 24,000
集計: 264,000

---
注記: HULFT Squareは月次自動更新でのご請求となります。

CSV化

御請求日,支払期限,合計金額,御請求日,銀行名,口座種別,口座番号,口座名義,請求先会社名,請求元会社名,請求元会社名住所,登録番号,請求サービス内容,数量,単価,金額,小計,消費税(10%),合計
20251215,2025-12-31,264000,20251215,1070052銀行,普通,1234567890,カ)セゾンテクノロジー,株式会社セゾンテクノロジー,株式会社 ABCDEFJ,東京都港区赤坂1-8-1 赤坂インターシティAIR 19F,T5656X5656,HULFT Square Starterプラン,1,240000,240000,240000,24000,264000

年月日の表記揺れがありますが、これはHULFT Squareで対応できそう。

まとめ

わりと良いのでは?!

今回のポイントは
プロンプトで細かく指定」 + 出力結果までの複数リクエスト」
だったかなと。

大抵の場合、請求書から必要な項目は決まっているかと思いますので
プロンプトで指定し易そう。

今回は綺麗なPDFの請求書でしたが、手書きやもう少しごちゃついたすキャンPDFもいけました。
(社外公開できるものではなく、ここでは綺麗なやつ)

またまた

9
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?