0
2

docker で pdf to text。docker(16)

Last updated at Posted at 2019-06-21

いろいろな作業はdockerで行い、docker hubにあげるようにしている。

  1. 仕事場、出張先で同じ機材で仕事ができるとは限らない。
    機材の運搬は疲れる。週に1日は手ぶらの日として、機材を運ばないようにしている。
  2. すべての機材でgit, dockerは利用できるようにしている。
     Windows, mac OS, Linux, Raspberry PI(Rasbian)で同じ作業をして確かめる。
  3. 誰か手伝ってくださる方がお見えなら手伝って欲しい
  4. Webに掲載されているもの(githubなど)だけで作業する
  5. 作業手順などはQiita, researchmapなどに記載する
  6. docker hubのDownloads目標を合計1000に設定。現在(892)

docker(4)docker hub とQiita
https://qiita.com/kaizen_nagoya/items/798358bba382d693e391

毎回、いろいろなところでつっかえる。

ubuntu
# apt install pdftotext
Reading package lists... Done
Building dependency tree       
Reading state information... Done
E: Unable to locate package pdftotext

え、pdftotextってaptで入らないの?

いえいえそうではありません。

macOS
$ docker run -v /Users/administrator/Downloads/nakamori:/home/nakamori -it ubuntu /bin/bash

macOSのフォルダに入っているpdfファイルを変換したい。
ファイル共有でubuntu起動。

pdftotextはpopper-utilsに入っているらしい。

ubuntu
# apt update; apt -y upgrade
# apt install -y poppler-utils vim

文字コード対応

macOS, Windowsでファイル共有で作業しているといつのまにか文字コードがubuntuのコマンドラインで読めないものがまじってしまう。

ubuntu
# apt -y install nkf
# nkf -w qc-nishimori.txt >qc-nishimori-u.csv

参考資料(reference)

量子計算機 arXiv掲載 西森 秀稔 論文単語帳作成をdockerで(文字コード対応)
https://qiita.com/kaizen_nagoya/items/319672853519990cee42

文書履歴(document history)

ver. 0.01 初稿 20190622 午前
ver. 0.02 hub追記 20190622 午後
ver. 0.03 体裁訂正 20220501
ver. 0.04 URL追記 20230308
このエントリーをはてなブックマークに追加
https://b.hatena.ne.jp/guide/bbutton

最後までおよみいただきありがとうございました。

いいね 💚、フォローをお願いします。

Thank you very much for reading to the last sentence.

Please press the like icon 💚 and follow me for your happy life.

0
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2