ここではpopplerのコマンドを使ってpdfをテキストに変換します。
popplerのインストール
qiita.rb
puts brew install poppler
デスクトップにパスを通す
qiita.rb
puts cd ~/Desktop
pdttotextコマンドを使用
qiita.rb
puts pdftotext -layout ファイル名 output_with_layout.txt
今回はレイアウトの保持のため-layout
オプションを追加しました
上ではpass.pdfというファイルを変換しているコードになります。
上記を実行すればoutput_with_layout.txtという名前のテキストファイルがデスクトップ上に生成され、PDFの内容がテキスト形式で保存されます。