Kar8
@Kar8

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

Google Apps Script(GAS)でPDFから文字列を抽出する方法が欲しい。

実現したいこと
Google Drive上に保存されているPDFファイルから文字列を抽出し、データとして取得したいと考えています。
現在の状況

Google Drive上にPDFファイルが保存されている
Google Apps Scriptを使用して処理を行いたい
PDFからテキストを抽出する方法を模索中

試したこと

DriveAppを使用してのHTML変換

質問事項

GASを使用してPDFから直接テキストを抽出する方法はありますか?
以下のような代替アプローチは可能でしょうか?

PDFをHTML形式に変換してからテキスト抽出
PDFをGoogle Docsに変換してからテキスト抽出
その他の中間フォーマットを経由する方法

もし上記の方法が可能な場合、具体的な実装方法やサンプルコードを共有いただけますでしょうか?

環境

Google Apps Script
PDFファイルはGoogle Drive上に保存済み

補足情報

処理対象のPDFは主にテキストベース(スキャンされたPDFではない)
文字列抽出後のデータ形式は特に指定なし(テキストとして取得できれば可)
定期的に実行することを想定

参考にしたドキュメント

Google Apps Script Documentation
DriveApp Class Reference

ご回答いただけますと幸いです。より詳細な情報が必要な場合は、お申し付けください。
こちらの質問はいかがでしょうか?必要に応じて追加や修正を加えることができます。

0

1Answer

Your answer might help someone💌