#はじめに
現場にいながらPythonなどで細々としたツール開発をしているk_mayo_beamです。
この記事では自分が試してみたパッケージをまとめてみます。
他にこんなのもあるよーっていう方がおりましたら、コメント等で教えてくれたらうれしいです。
#Excelに関する業務
現場でダントツに多いExcel業務です。
##Openpyxl
PythonでExcelファイルの操作ができるパッケージです。
機能的にはExcelVBAでできることの8割ってところでしょうか(体感)。
多数のExcelファイルに同様の変更をするなどの業務を自動化できます。
結合セルに罫線が引かれているファイルは読み込むと罫線が壊れてしまう既知の問題があり、日本流の複雑な帳票作成には相性が悪いのが欠点です。
##pandas
データ分析に特化したDataframeという型を提供するパッケージです。
ExcelファイルやCSV形式での大量のデータを集計、分析、グラフ化することができます。
今のところExcelデータの抽出やフォーマット修正などの自動化に使用することが多いです。
後述のPyinstallerでexe化するのが大変で、配布がめんどくさいです。
##win32com
仕組みはよく理解していないですが、WindowsのアプリをPythonから触ることができるツールです。
とりわけ、ExcelをPythonから起動し、マクロを実行するのに使用しています。
既存のマクロを使う業務を複数つなげることができるので、意外に使えます。
また、本家Excelを起動するので、ファイルや表示が壊れるなんてことが少ないのも特徴で、帳票作成の自動化はこれで開発しています。
当然、Windows以外や本家Excelがインストールされていない環境では使用できないでしょう。
#PDFに関する業務
PDFをマージしてみたり、分割してみたり、書いてあることをまとめたり。。。
なんか作業的な業務が多いけど、自動化が面倒なPDFに関する業務です。
##PyPDF2
PDFの内容に関係のない、分割やマージといった機能を提供するパッケージです。
基本的に分割とマージに使って、自動化の一部を担うことが多いです。
一応、文字を挿入したり、画像を差し込んでみたりもできるらしいです。
##PDFminer
PDFを文字列化する機能を提供するパッケージです。
PDFを文字列化して、リネームに使用したりします。
OCR機能ではないので、画像部分を文字列化することはできません。
#最後に
2018/9/8段階では、ExcelとPDFについて使用したものをまとめています。
個別の具体的な事例は追って記事にできたらいいなぁと思っています。
また何か見つけたら更新しますね。