こんにちは
pdftotextコマンドをfindと組み合わせて使うことにし、シェルスクリプトに仕立てました。ファイル名が行頭に表示されるようにしました。
$ find . -name "*.pdf" -print0 | xargs -0 ./pdftotext.sh
./1.pdf: ...
./1.pdf: ...
./2.pdf: ...
:
:
pdftotext.sh
# !/bin/sh
options=""
while [ $# -gt 0 ]; do
case "$1" in
-*) options="$options $1"; shift ;;
*) break ;;
esac
done
for file in "$@"; do
[ "${file##*.}" != "pdf" ] && continue
pdftotext $options "$file" - | while read -r line; do printf '%s\n' "$file: $line"; done
done
exit