文書の形式の多様性は、情報交換手段を豊かにしました。その中でもWord文書は、その強力な機能性から広く使われています。しかし、ネット上での共有、バージョン管理、コードの閲覧や編集などの面では、Markdown形式がその簡潔さ、読みやすさ、編集しやすさなどの特徴から独自の利点を示しています。Word文書をMarkdown形式に変換することで、文書の構造を簡素化し、余分な書式情報を削除し、さまざまなテキストエディタで内容を素早く表示および編集することができます。また、GitHubやGitLabなどのバージョン管理システムで文書をより良く管理およびメンテナンスすることや、HTMLやPDFなどのさまざまな出力形式を簡単に生成することもできます。本記事では、.NETプラットフォームでC#コードを使用してWord文書をMarkdown形式に変換する方法を紹介します。
この記事では、Spire.Doc for .NETを使用します。公式ウェブサイトから入手するか、NuGetを通じて取得できます:PM> Install-Package Spire.Doc
。
Word文書をMarkdown形式に変換する方法
Markdownファイルでは、リンク形式で画像が保存されるため、文書内の画像は直接Markdownファイルに変換することはできず、別途処理する必要があります。変換に使用する文書は、Markdownでサポートされていないコンテンツ形式ができるだけ含まれないようにする必要があります。
Document.LoadFromFile(string fileName, FileFormat fileFormat)
メソッドを使用して、ファイルからWord文書、RTF文書、XML文書、WPS文書などの形式の文書を読み込み、Document.SaveToFile(string fileName, FileFormat.Markdown)
メソッドを使用してこれらの文書をMarkdown形式に変換して保存することができます。
以下に詳細な手順を示します:
-
Spire.Doc
名前空間をインポートします。 -
Document
オブジェクトを作成します。 -
Document.LoadFromFile()
メソッドを使用してWord文書を読み込みます(FileFormat
で形式を指定)。 -
Document.SaveToFile()
メソッドを使用して文書をMarkdown形式に変換して保存します。 - リソースを解放します。
コード例:
using Spire.Doc;
namespace MdToDocx
{
class Program
{
static void Main(string[] args)
{
// Documentオブジェクトの作成
Document doc = new Document();
// Word文書の読み込み
doc.LoadFromFile("サンプル.docx", FileFormat.Docx);
// 文書をMarkdown形式に変換して保存
doc.SaveToFile("WordからMarkdownへの変換.md");
doc.Close();
}
}
}
この記事では、.NETプラットフォームでC#コードを使用してWord文書をMarkdown形式に変換する方法について説明しました。
より多くのWord文書の操作や変換チュートリアルについては、Spire.Doc for .NETのチュートリアルページをご覧ください。
問題が発生した場合は、Spire.Docフォーラムで技術サポートを受けることができます。