HTMLは、ウェブページを作成するために使用されるマークアップ言語である。HTMLファイルを解析するには、ウェブブラウザが必要です。HTMLファイルをより読みやすくしたい場合は、HTMLファイルをWordに変換するのが良い方法です。この記事では、無料の.NETライブラリを使用して、シンプルなHTMLファイルをWord文書に変換する方法を紹介します。
無料.NETワードライブラリ
Free Spire.Doc for .NETライブラリをインストールするには2つの方法があります。1つはNuget経由でインストールする方法、もう1つは下記のリンクから製品パッケージをダウンロードし、ローカルパスから手動でプロジェクトにdllを追加する方法です。
C# - HTMLをWordに変換
C#でHtmlファイルをWord文書にプログラム変換するのはとても簡単です。以下の2つのステップを踏むだけだ:
1. Document.loadFromFile(String fileName, FileFormat fileFormat, XHTMLValidationType validationType)
メソッドでHtmlファイルを読み込みます.
2. Document.saveToFile(String fileName, FileFormat fileFormat)
メソッドを使用して、HTMLファイルを.doc/.docxドキュメントに変換します。
C#のサンプルコードです:
using Spire.Doc;
namespace ConvertHTMLtoWord
{
internal class Program
{
static void Main(string[] args)
{
//HTMLファイルを読み込む
Document document = new Document();
document.LoadFromFile(@"E:\PythonDoc\input日.html");
//HTMLファイルをWordとして保存する
document.SaveToFile("HtmltoWord.docx", FileFormat.Docx2013);
}
}
}
この無料ライブラリは、WordからHTML、WordからPDF、WordからXMLなどへの変換もサポートしています。
注:無料APIには一定のページ制限があります。詳しくはこちらをご覧ください:https://www.e-iceblue.com/Introduce/free-doc-component.html