More than 1 year has passed since last update.

PythonでHTMLファイルや文字列をPDFに変換する方法

Posted at 2024-01-12

ウェブページからドキュメントを生成することは一般的な要求です。ウェブページのコンテンツをアーカイブしたり、オフラインで共有したり、印刷可能なレポートを作成したりする場合、HTMLファイルを安定して広くアクセス可能なPDF形式に変換するための信頼性のある方法が頻繁に必要とされます。強力なPython言語を利用することで、WebページのコンテンツからPDFを生成することが容易に実現できます。

この記事では、Pythonコードを使用してHTMLからPDFに変換する方法に焦点を当て、変換の主な手順やコードの例などを紹介します。以下の内容がカバーされます：

Pythonを使用してHTMLをPDFに変換するポイント
Pythonを使用してHTMLからPDFに変換する手順とコードの例
Pythonを使用してHTML文字列をPDFにレンダリングする手順とコードの例
無料のオンラインHTMLからPDFへの変換ツール

Pythonを使用してHTMLをPDFに変換するポイント

Pythonのライブラリを活用することで、開発者やユーザーは簡単に見栄えの良いPDFドキュメントを生成できます。内容、フォーマット、ハイパーリンクを含めたプロフェッショナルな外観のPDFドキュメントを、Pythonプログラムを使用して自動化することも可能です。ただし、動的コンテンツやレンダリングの違いなどの理由により、HTMLからPDFへの変換にはいくつかの制約があります。したがって、最良の結果を得るために、Pythonを使用してHTMLからPDFに変換する場合、開発者はシンプルなウェブページを選択するか、変換前にHTMLファイルを前処理するなどの方法を選択することができます。
この記事で紹介する方法には、Spire.Doc for Pythonが必要です。公式ウェブサイトからダウンロードするか、PyPIを介してインストールできます：pip install Spire.Doc。

HTMLをPDFに変換する際にこのAPIを使用する際には、主に次のクラスとメソッドが使用されます：

アイテム	説明
Document クラス	Word文書を表すクラス。
Document.LoadFromFile() メソッド	DOCX、HTML、およびその他の形式のファイルをWord文書として読み込むメソッド。
Document.SaveToFile() メソッド	Word文書をDOCX、PDF、HTML、およびその他の形式のファイルに保存するメソッド。
Paragraph.AppendHTML() メソッド	HTML文字列をドキュメントに表示するメソッド。
FileFormat	異なる種類のファイル形式を表す列挙型。
XHTMLValidationType	XHTMLのバリデーションオプションを表す列挙型。バリデーションなし、厳格なバリデーション、およびトランジションバリデーションが含まれます。

Pythonを使用してHTMLからPDFに変換する手順とコードの例

LoadFromFileメソッドを使ってHTMLファイルを読み込み、SaveToFileメソッドを使ってPDFファイルとして保存することで、開発者はシンプルなPythonコードを使ってHTMLをPDFに変換することができます。主な手順は以下の通りです：

必要なモジュールをインポートします。
Document クラスのオブジェクトを作成します。
Document.LoadFromFile() メソッドを使用してHTMLファイルをロードします。
Document.SaveToFile() メソッドを使用してHTMLファイルをPDFに変換して保存します。

以下はPythonでHTMLをPDFに変換するコードの例です：

from spire.doc import Document
from spire.doc import FileFormat
from spire.doc import XHTMLValidationType

# Document クラスのオブジェクトを作成します
doc = Document()

# HTML ファイルを読み込みます
doc.LoadFromFile("Sample.html", FileFormat.Html, XHTMLValidationType.none)

# ファイルを PDF 形式に変換して保存します
doc.SaveToFile("output/HTMLからPDFに変換.pdf", FileFormat.PDF)
doc.Close()

変換結果：

Pythonを使用してHTML文字列をPDFにレンダリングする手順とコードの例

HTML文字列は通常、ウェブページの構造とレンダリングを記述するために使用される、HTMLタグ、属性、およびコンテンツを含むテキストです。Paragraph.AppendHTML() メソッドを使用することで、簡単にHTML文字列をドキュメントにレンダリングし、それをPDFファイルとして保存することができます。主な手順は以下の通りです：

必要なモジュールをインポートします。
Document クラスのオブジェクトを作成します。
Document.AddSection() メソッドを使用してドキュメントにセクションを追加し、Section.AddParagraph() メソッドを使用してセクションに段落を追加します。
HTML文字列を指定します。
Paragraph.AppendHTML() メソッドを使用してドキュメントにHTML文字列をレンダリングします。
Document.SaveToFile() メソッドを使用してドキュメントをPDFに変換して保存します。

以下はPythonでHTML文字列をPDFに変換するコードの例です：

from spire.doc import Document
from spire.doc import FileFormat

# Document クラスのオブジェクトを作成します
doc = Document()

# セクションを追加します
sec = doc.AddSection()

# 段落を追加します
par = sec.AddParagraph()

# HTML 文字列を指定します
htmlString = """
<html>
<head>
  <title>HTML サンプル</title>
</head>
<body>
  <h1 style="color: blue;">私のウェブサイトへようこそ</h1>

  <h2>個人情報</h2>
  <ul>
    <li>名前：John Doe</li>
    <li>年齢：30</li>
    <li>国籍：アメリカ</li>
  </ul>

  <h2>職務経歴</h2>
  <table border="1">
    <tr>
      <th>会社</th>
      <th>役職</th>
      <th>年月</th>
    </tr>
    <tr>
      <td>ABC 会社</td>
      <td>ソフトウェアエンジニア</td>
      <td>2018-2020</td>
    </tr>
    <tr>
      <td>XYZ 会社</td>
      <td>プロジェクトマネージャー</td>
      <td>2020-2022</td>
    </tr>
  </table>

  <h2>プロジェクトリスト</h2>
  <ol>
    <li>プロジェクト A</li>
    <li>プロジェクト B</li>
    <li>プロジェクト C</li>
  </ol>

</body>
</html>
"""

# HTML 文字列をドキュメントにレンダリングします
par.AppendHTML(htmlString)

# ドキュメントを PDF ファイルとして保存します
doc.SaveToFile("output/HTML文字列をPDFに変換.pdf", FileFormat.PDF)
doc.Close()

生成されたPDFドキュメント：

無料のオンラインHTMLからPDFへの変換ツール

少量でシンプルなHTMLファイルをPDFドキュメントに変換する必要があり、複雑な操作を必要としない場合は、無料のオンラインPDF変換ツールを使用することをお勧めします。このツールを使用すると、HTMLファイルを簡単にアップロードし、生成されたPDFドキュメントをダウンロードすることで、簡単に変換することができます。シンプルな直接的な解決策を提供し、簡単かつ迅速に変換操作を行うことができます。

まとめ

以上の記事では、Pythonを使用してHTMLからPDFに変換する方法について説明しました。Pythonを使用してHTMLをPDFに変換する利点と制限について説明し、Spire.Doc for Pythonを使用したHTMLからPDFおよびHTML文字列からPDFへの変換方法とコードの例を提供しました。上記の方法を参考にすることで、開発者は自動化された高品質の変換を実現するためのPythonプログラムを作成することができます。質問がある場合は、Spire.Docフォーラムで技術サポートを求めることができます。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up