0
0

More than 1 year has passed since last update.

Java で Word を HTML ファイル形式に変換する

Last updated at Posted at 2023-08-29

はじめに

HTML ファイルは、Web ページの作成に使用される、ハイパーテキスト マークアップ言語で記述されたテキスト ファイルです。 Web ページの構造、コンテンツ、スタイルなどの情報が含まれています。 Word 文書を HTML ファイルに変換すると、Word 文書内のテキスト、見出し、段落、リスト、表、画像、その他の要素を、対応する HTML タグと属性に変換できます。 この変換により、ドキュメントのコンテンツを Web 上に簡単に公開できるだけでなく、ドキュメントがさまざまなプラットフォームやデバイス間で一貫して表示されるようになります。 関連する方法を以下に説明します。

ツール

Jarファイルの導入

  • Free Spire.Doc for Javaをダウンロードして解凍します。
  • IDEAで新しいプロジェクトを作成します。
  • 「File」>「Project Structure」>「Modules」>「Dependencies」をクリックします。
  • 「+」の「JARs or Directories」を選択します。
  • 「Spire.doc.jar」を見つけてプロジェクトにインポートします。

コード:

import com.spire.doc.*;

public class WordToHtml {
    public static void main(String[] args) {

        //Documentインスタンスの作成
        Document document = new Document();

        //Word文書を読み込みます
        document.loadFromFile("sample.docx");

        //Wordを HTML として保存します
        document.saveToFile("output/toHtml.html", FileFormat.Html);
    }
}

上記のコードでは、まず、 Document インスタンスが作成されます。 loadFromFile() メソッドを呼び出して Word 文書を読み込みます。最後に saveToFile(String fileName, FileFormat fileFormat) メソッドを通じて文書を HTML ファイルとして保存します。

Free Spire.Doc for Java の saveToFile(String fileName, FileFormat fileFormat) メソッドは、Word から PDF画像XPSなどのさまざまな文書形式への変換をサポートします。
image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0