1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【Python CLI】青空文庫のXHTML本からEPUBに変換するツールを作った

Last updated at Posted at 2023-06-01

初めに

自分のCalibre Webインスタンスを設定した頃に、青空の本を集めたかったから、そのようなツールを探していました。AozoraEpub3を見つけましたが、自分のLinuxシステムにインストールできなかったので自作ツールに決めました。

とても簡単なツールであり、URLからXHTMLを変換することができます。requestモジュールがURLをデータになり、そして bs4 を使って知らないHTMLタグを除く、題名の情報を集めることができます。最後に、 ebooklib が全ての情報(作家、題名)をepubファイルになります。自分のKindleがちゃんと表示できます。

使った外部モジュールは ebooklibbs4 だけです。

もしかして、他のサイトも変換できますが、青空文庫の本だけが試しました。

機能

-t-yが縦書きと横書きの設定です。 デフォルトは縦書き。
-oプログラムの出力ファイルの設定です。

$ pyaozora -y -o 吾輩は猫である.epub "https://www.aozora.gr.jp/cards/000148/files/789_14547.html"

URLは作品の図書カードのXHTML版リンクです。
image.png

ソースコード

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?