D-Y
@D-Y

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

Chat GPTでPDFを扱う際のページ指定について

解決したいこと

ChatGPT 4oで,日本語書籍のPDFを読み込み,5ページごとに要約したい。
プロンプトの正確性を上げるため,正確にPDFファイルのページ指定を行いたい。

発生している問題・エラー

・最初の5ページを読み込んで要約
・次の5ページを読み込んで要約…
としたいのですが,対象ページの理解がずれていく場合が多く困っています。
途中で「51ページにはこの見出しがある」など指摘すると修正されますが,
複数のファイルについて処理できるプロンプトにしたいため,正確性を上げたいと思っています。

自分で試したこと

プロンプトでのPDFファイルのページ指定方法に問題があると考えています。
ファイル上のページ数と,紙面に記されたページ番号がずれているのに加え,
アウトプットの精度を上げるため,書籍の100~200ページのPDFなど細切れのファイルを扱っています。
細切れにする際にブックマーク情報は削除しています。

PDFファイルをChat GPTで扱う際に,(正しい表現ではないかもしれませんが)論理ページ(紙面に示されるノンブル)と物理ページ(PDFファイルにおける何ページ目か)をどのように指定するのが適切でしょうか。
Acrobatなど各アプリで既定の名前で定義されているものがありましたらその項目名を,またChat GPTで表現する際に有効な記述方法があればその方法を教えてください。よろしくお願いします。

0

1Answer

5ページごとにpdfファイルを作って、5ページ分のpdfをアップロード、要約、5ページ分のpdfをアップロード、要約が最も良い方法かと。

前後の文脈が課題になる場合は対象5ページの前後10ページ程度を入れるように、25ページごとにカット、5ページずらして25ページカットとやればうまくいくかと。

0Like

Your answer might help someone💌