デジタル時代において、テキストとWordドキュメント(.docx)の間でデータを変換するニーズは、多くの場面で重要です。例えば、簡単なメモを見やすいレイアウトの文書に変換したり、Wordドキュメントから必要な情報を抽出して分析に活用したりする場合があります。Pythonを活用することで、これらの作業を効率的かつ柔軟に行うことが可能です。本記事では、Pythonを使ってテキストをWordドキュメントに変換する方法と、その逆の手順について解説します。
この記事で使用する方法には、Spire.Doc for Pythonが必要である。PyPI: pip install spire.doc
。
PythonでテキストファイルをWord文書に変換する
テキストファイルは、Document.LoadFromFile メソッドを使用して読み込むことができ、その後、Document.SaveToFile メソッドを使用して Word ドキュメントに変換することができます。また、ドキュメントの内容をフォーマットするために、ライブラリーのインターフェイスを使うこともできます。
詳しい手順は以下の通りです。
- 必要なモジュールをインポートする:
Document
とFileFormat
。 -
Document
クラスのインスタンスを作成します。 -
Document.LoadFromFile()
メソッドを使用してテキストファイルを読み込みます。 -
Document.SaveToFile()
メソッドを使用して、テキストファイルを Word ドキュメントに変換して保存します。 - リソースを解放します。
コード例
from spire.doc import Document, FileFormat, ParagraphStyle
# Document のインスタンスを作成
doc = Document()
# テキストファイルを読み込む
doc.LoadFromFile("Sample.txt", FileFormat.Txt)
# 書式設定を適用(任意)
style = ParagraphStyle(doc)
style.CharacterFormat.FontName = "Yu Gothic UI" # フォント名を設定
style.CharacterFormat.FontSize = 12 # フォントサイズを設定
style.Name = "Style1" # スタイル名を設定
doc.Styles.Add(style)
for i in range(doc.Sections.get_Item(0).Paragraphs.Count): # 各段落にスタイルを適用
paragraph = doc.Sections.get_Item(0).Paragraphs.get_Item(i)
paragraph.ApplyStyle(style.Name)
# ファイルをWord文書に変換して保存
doc.SaveToFile("output/TextToWord.docx", FileFormat.Docx)
doc.Close()
PythonでWord文書をテキストファイルに変換する
同じメソッドを異なるパラメータで使用することで、Word ドキュメントをテキストファイルに変換することもできます。詳しい手順は以下の通りです。
- 必要なモジュール(
Document
とFileFormat
)をインポートします。 -
Document
クラスのインスタンスを作成します。 -
Document.LoadFromFile()
メソッドを使用して Word ドキュメントを読み込みます。 -
Document.SaveToFile()
メソッドを使用して、ドキュメントをテキストファイルに変換して保存します。 - リソースを解放します。
コード例
from spire.doc import Document, FileFormat
# Document クラスのインスタンスを作成
doc = Document()
# Word ドキュメントを読み込む
doc.LoadFromFile("Sample.docx", FileFormat.Docx)
# ドキュメントをテキストファイルに変換して保存
doc.SaveToFile("output/WordToText.txt", FileFormat.Txt)
doc.Close()
この記事では、Pythonを使ってテキストファイルをWord文書に変換する方法と、Word文書をテキストファイルに変換する方法を紹介します。