Chat GPTでPDFを扱う際のページ指定について
解決したいこと
ChatGPT 4oで,日本語書籍のPDFを読み込み,5ページごとに要約したい。
プロンプトの正確性を上げるため,正確にPDFファイルのページ指定を行いたい。
発生している問題・エラー
・最初の5ページを読み込んで要約
・次の5ページを読み込んで要約…
としたいのですが,対象ページの理解がずれていく場合が多く困っています。
途中で「51ページにはこの見出しがある」など指摘すると修正されますが,
複数のファイルについて処理できるプロンプトにしたいため,正確性を上げたいと思っています。
自分で試したこと
プロンプトでのPDFファイルのページ指定方法に問題があると考えています。
ファイル上のページ数と,紙面に記されたページ番号がずれているのに加え,
アウトプットの精度を上げるため,書籍の100~200ページのPDFなど細切れのファイルを扱っています。
細切れにする際にブックマーク情報は削除しています。
PDFファイルをChat GPTで扱う際に,(正しい表現ではないかもしれませんが)論理ページ(紙面に示されるノンブル)と物理ページ(PDFファイルにおける何ページ目か)をどのように指定するのが適切でしょうか。
Acrobatなど各アプリで既定の名前で定義されているものがありましたらその項目名を,またChat GPTで表現する際に有効な記述方法があればその方法を教えてください。よろしくお願いします。