Word文書(.docまたは.docx)とテキストファイル(.txt)は、よく使われる2つのファイル形式です。Word文書は複雑な文書処理やレイアウトによく使われ、TXTファイルはプレーンテキスト情報の保存や送信に使われます。この2つの形式の変換方法を理解することで、作業効率を向上させ、ファイル管理を容易にすることができます。
今回は、Word形式とTXT形式の変換をPythonで実装する方法を紹介します。
Python Word変換ライブラリ
Spire.Doc for Pythonは、様々なWord文書変換・操作機能をサポートするプロフェッショナルなライブラリです。pip経由で直接インストールできます:
pip install Spire.Doc
PythonでWord(Doc/Docx)をTXTに変換する
ステップ:
- 必要なモジュールをインポートする;
-
Document
クラスのオブジェクトを作成します; -
LoadFromFile()
メソッドを使用して、.doc または .docx ドキュメントをロードします; -
SaveToFile(fileName, FileFormat.Txt)
メソッドを使用して、Word文書をtxt形式で保存します; - ドキュメントを閉じます。
from spire.doc import *
from spire.doc.common import *
# .docまたは.docx文書の読み込み
document = Document()
document.LoadFromFile("AI日.docx")
# TXTファイルとして保存する
document.SaveToFile("Word2Txt.txt", FileFormat.Txt)
document.Close()
PythonでTXTをWord(Doc/Docx)に変換する
ステップ:
- 必要なモジュールをインポートする;
-
Document
クラスのオブジェクトを作成する; -
LoadFromFile()
メソッドを使用して TXT ドキュメントを読み込みます; -
SaveToFile()
メソッドを使用して、TXT ドキュメントを Word Doc または Docx 形式で保存します; - ドキュメントを閉じる。
from spire.doc import *
from spire.doc.common import *
# txtファイルを読み込む
document = Document()
document.LoadFromFile("Word2Txt.txt")
# DocまたはDocx形式で保存する
document.SaveToFile("Txt2Doc.doc", FileFormat.Doc)
document.SaveToFile("Txt2Docx.docx", FileFormat.Docx2016)
document.Close()
結論
Spire.Doc for Pythonライブラリを使えば、簡単なコードでWordからTXT、TXTからWordへの変換を実現できます。Wordから他のフォーマットへの変換が必要な場合は、例を参照してください: