1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

[Tips]pdf-readerでパスワード付きファイルからデータを抽出する

Posted at

pdfの中身を抽出する方法は各言語様々な方法があると思いますが、rubyでやる方法の一つとしてpdf-readerを利用する方法があります。
gemのインストール後、以下のようなコードで簡単にページのテキストやメタデータを見ることができます。

require 'pdf-reader'

reader = PDF::Reader.new("sample.pdf")

puts reader.pdf_version
puts reader.info
puts reader.metadata
puts reader.page_count
reader.pages.each do |page|
  puts page.text
  puts page.fonts
end

ただ今回扱うファイルがパスワード付きだったので、どうするのかReadmeを見たところ特に言及はありませんでした。
どうしたものかと思っていましたが、gemのテストを見たところ答えがありました。

require 'pdf-reader'

-reader = PDF::Reader.new("sample.pdf")
+reader = PDF::Reader.new("sample.pdf",password: 'ここに入力')

puts reader.pdf_version
puts reader.info
puts reader.metadata
puts reader.page_count
reader.pages.each do |page|
  puts page.text
  puts page.fonts
end

そのままpasswordを引数として渡してあげればいいみたいです。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?