以前の記事で、Spire.Doc for Pythonライブラリを使用してWordをHTML形式に変換する方法を紹介しましたが、このライブラリはHTMLからWord文書への変換も実現できます。プログラミングによってHTMLをWordに変換することで、手作業でコピー&ペーストするような、時間がかかり、エラーが起こりやすく、書式が混乱してしまう可能性のある作業を避けることができます。
Spire.Doc for Pythonライブラリは、わずか数行のコードでHTMLファイルをWord Docxフォーマットに変換します。以下はその方法です。
Pythonライブラリのインストール方法:
Python Wordライブラリは、以下のpipコマンドでインストールできます:
pip install Spire.Doc
HTMLをWordに変換するPythonコード例
from spire.doc import *
from spire.doc.common import *
# Documentクラスのオブジェクトを作成する。
document = Document()
# HTMLファイルを読み込む
document.LoadFromFile("input.html", FileFormat.Html, XHTMLValidationType.none)
# HTMLファイルをDocx形式で保存する
document.SaveToFile("HtmltoWord.docx", FileFormat.Docx2016)
document.Close()
上のコードでは、まず.htmlファイルを読み込み、次にDocument.SaveToFile() メソッドを呼び出してHTMLファイルを.docx形式で保存しています。HTMLからWordへの変換は、たった3行のPythonコードで簡単に実現できます。
その他のWord文書処理や変換機能については、オンラインチュートリアルをご覧ください:
https://www.e-iceblue.com/Tutorials/Python/Spire.Doc-for-Python/Program-Guide/Spire.Doc-for-Python-Program-Guide-Content.html