LoginSignup
0
1

【Java】Word文書の空白行を削除する方法

Posted at

スキャンや変換などで作成されたWord文書には、非常に多くの空白行がある場合があります。 これらは文書の書式を混乱させ、文書の外観に影響を与え、読みにくくする可能性があります。 そのため、文書の可読性と美観を高めるためには、これらの空白行を削除する必要があります。 この記事では、無料のFree Spire.Doc for Javaを使用して、Javaプログラム経由でWord文書から空白行をすばやく削除する方法を紹介します。

【依存関係の追加】

この記事の方法は、無料のWord文書処理Java API、Free Spire.Doc for Javaが必要です。このAPIは、公式サイトからダウンロードするか、Mavenでプロジェクトに導入することができます。Mavenのコードは以下の通りです。

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>

Word文書内のすべての空白行を削除する

Word文書のセクションをループし、各セクションの子オブジェクトをループし、空の段落である子オブジェクトを削除するだけで、文書のすべての空行を削除することができる。スペースを含む空白行も削除される。詳しい手順は以下の通り。

  • Document クラスのオブジェクトを作成します。
  • Document.loadFromFile() メソッドを使用してWord文書を読み込みます。
  • 各セクションをループし、各セクションの子オブジェクトをループします。
  • 子オブジェクトが段落であるかどうかを判断し、段落であれば段落のテキストを使って文字列オブジェクトを作成します。
  • 文字列オブジェクトがNULLかどうかを判断し、NULLの場合は対応する段落を削除します。
  • Document.saveToFile() メソッドを使用して文書を保存します。

コード例

import com.spire.doc.*;
import com.spire.doc.documents.*;

public class removeEmptyLines {
    public static void main(String[] args) {
        //Documentクラスのオブジェクトを作成する
        Document document = new Document();

        //Word文書を読み込む
        document.loadFromFile("サンプル.docx");

        //文書内のすべてのセクションをループする
        for (Section section : (Iterable<? extends Section>) document.getSections()) {
            //各セクションのすべての子オブジェクトをループする
            for (int i = 0; i < section.getBody().getChildObjects().getCount(); i++) {
                //各子オブジェクトが段落かどうかを判断する
                if ((section.getBody().getChildObjects().get(i).getDocumentObjectType().equals(DocumentObjectType.Paragraph) )) {
                    //各段落オブジェクトのテキストを使用して文字列オブジェクトを作成する
                    String s= ((Paragraph)(section.getBody().getChildObjects().get(i))).getText().trim();
                    //文字列オブジェクトがNULLかどうかを判定する
                    if (s.isEmpty()) {
                        //空の段落を削除する
                        section.getBody().getChildObjects().remove(section.getBody().getChildObjects().get(i));
                        i--;
                    }
                }
            }
        }

        //文書を保存する
        document.saveToFile("空白行の削除.docx", FileFormat.Docx_2019);
    }
}

Word文書内のすべての空白行を削除する

この記事では、無料のJava用Spire.Docを使って空白行を削除する方法を紹介します。段落を削除するのではなく、非表示にしたい場合は「段落を非表示にする方法」をご覧ください。

また、Spire.Doc for Javaチュートリアルで詳細を確認したり、Spire.Docフォーラムで他のユーザーと議論することもできます。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1