はじめに
HTML ファイルは、Web ページの作成に使用される、ハイパーテキスト マークアップ言語で記述されたテキスト ファイルです。 Web ページの構造、コンテンツ、スタイルなどの情報が含まれています。 Word 文書を HTML ファイルに変換すると、Word 文書内のテキスト、見出し、段落、リスト、表、画像、その他の要素を、対応する HTML タグと属性に変換できます。 この変換により、ドキュメントのコンテンツを Web 上に簡単に公開できるだけでなく、ドキュメントがさまざまなプラットフォームやデバイス間で一貫して表示されるようになります。 関連する方法を以下に説明します。
ツール
- IntelliJ IDEA 2018 (jdk 1.8.0)
- Free Spire.Doc for Java
Jarファイルの導入
- Free Spire.Doc for Javaをダウンロードして解凍します。
- IDEAで新しいプロジェクトを作成します。
- 「File」>「Project Structure」>「Modules」>「Dependencies」をクリックします。
- 「+」の「JARs or Directories」を選択します。
- 「Spire.doc.jar」を見つけてプロジェクトにインポートします。
コード:
import com.spire.doc.*;
public class WordToHtml {
public static void main(String[] args) {
//Documentインスタンスの作成
Document document = new Document();
//Word文書を読み込みます
document.loadFromFile("sample.docx");
//Wordを HTML として保存します
document.saveToFile("output/toHtml.html", FileFormat.Html);
}
}
上記のコードでは、まず、 Document インスタンスが作成されます。 loadFromFile() メソッドを呼び出して Word 文書を読み込みます。最後に saveToFile(String fileName, FileFormat fileFormat) メソッドを通じて文書を HTML ファイルとして保存します。
Free Spire.Doc for Java の saveToFile(String fileName, FileFormat fileFormat) メソッドは、Word から PDF、画像、XPSなどのさまざまな文書形式への変換をサポートします。