0
0

PythonでWordをTXTに、またはTXTをWordに変換する

Posted at

Word文書(.docまたは.docx)とテキストファイル(.txt)は、よく使われる2つのファイル形式です。Word文書は複雑な文書処理やレイアウトによく使われ、TXTファイルはプレーンテキスト情報の保存や送信に使われます。この2つの形式の変換方法を理解することで、作業効率を向上させ、ファイル管理を容易にすることができます。
今回は、Word形式とTXT形式の変換をPythonで実装する方法を紹介します。

Python Word変換ライブラリ

Spire.Doc for Pythonは、様々なWord文書変換・操作機能をサポートするプロフェッショナルなライブラリです。pip経由で直接インストールできます:

pip install Spire.Doc

PythonでWord(Doc/Docx)をTXTに変換する

ステップ:

  1. 必要なモジュールをインポートする;
  2. Document クラスのオブジェクトを作成します;
  3. LoadFromFile() メソッドを使用して、.doc または .docx ドキュメントをロードします;
  4. SaveToFile(fileName, FileFormat.Txt) メソッドを使用して、Word文書をtxt形式で保存します;
  5. ドキュメントを閉じます。
from spire.doc import *
from spire.doc.common import *

# .docまたは.docx文書の読み込み
document = Document()
document.LoadFromFile("AI日.docx")

# TXTファイルとして保存する
document.SaveToFile("Word2Txt.txt", FileFormat.Txt)
document.Close()

結果:
Word-TXT.png

PythonでTXTをWord(Doc/Docx)に変換する

ステップ:

  1. 必要なモジュールをインポートする;
  2. Documentクラスのオブジェクトを作成する;
  3. LoadFromFile() メソッドを使用して TXT ドキュメントを読み込みます;
  4. SaveToFile() メソッドを使用して、TXT ドキュメントを Word Doc または Docx 形式で保存します;
  5. ドキュメントを閉じる。
from spire.doc import *
from spire.doc.common import *

# txtファイルを読み込む
document = Document()
document.LoadFromFile("Word2Txt.txt")

# DocまたはDocx形式で保存する
document.SaveToFile("Txt2Doc.doc", FileFormat.Doc)
document.SaveToFile("Txt2Docx.docx", FileFormat.Docx2016)
document.Close()

結果:
TXT-Word.png

結論

Spire.Doc for Pythonライブラリを使えば、簡単なコードでWordからTXT、TXTからWordへの変換を実現できます。Wordから他のフォーマットへの変換が必要な場合は、例を参照してください:

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0