gemのインストール
- Gemfileに
gem 'pdf-reader'
を追加してbundle install
Pdfの読み込み
- Railsのタスクに登録して見る
lib/tasks/read_pdf.rake
namespace :read_pdf do
desc 'PDF読み込み' # rake -T で表示する説明
task read: :environment do
# Report.pdfの読み込み処理
reader = PDF::Reader.new('xxxx.pdf') # 読み込むPDF名
reader.pages.each do |page|
puts page.text # 読み込んだテキストの出力
end
end
end
rails -T
でタスクに登録されているか確認する。
$ rails -T
~~~~~略~~~~~
rails read_pdf:read # PDF読み込み
~~~~~略~~~~~
$
ちゃんと登録されているようなので、rails read_pdf:read
で実行する。
こちらのPDFサンプルを読み込んでみる
$ rails -T
1%' αϯϓϧσʔλ
͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ 1%'
αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧσʔ
λ͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ
1%' αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ 1%' αϯϓϧ
σʔλ͓Βͤ 1%' αϯϓϧσʔλ
͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ
1%' αϯϓϧσʔλ͓Βͤ 1%' α
ϯϓϧσʔλ͓Βͤ 1%' αϯϓϧ
σʔλ͓Βͤ 1%' αϯϓϧσʔλ͓
Βͤ 1%' αϯϓϧσʔλ͓Βͤ
1%' αϯϓϧσʔλ͓Βͤ 1%' α
ϯϓϧσʔλ͓Βͤ 1%' αϯϓϧ
σʔλ͓Βͤ 1%' αϯϓϧσʔλ͓
Βͤ 1%' αϯϓϧσʔλ
͓Βͤ 1%' αϯϓϧσʔλ͓Βͤ
1%' αϯϓϧσʔλ͓Βͤ 1%' α
ϯϓϧσʔλ͓Βͤ 1%' αϯϓϧ
σʔλ͓Βͤ 1%' αϯϓϧσʔλ͓
Βͤ 1%' αϯϓϧσʔλ͓Βͤ
1%' αϯϓϧσʔλ͓Βͤ 1%' α
ϯϓϧσʔλ͓Βͤ 1%' αϯϓϧ
σʔλ͓Βͤ 1%' αϯϓϧσʔλ͓
Βͤ 1%' αϯϓϧσʔλ
$
めっちゃ文字化けした。。。
GitHubの説明を見たら、PDFのエンコードによらずUTF-8でに変換されると。。。
エンコードを指定できなさそうなので、他のGemを探すことに。。。