More than 3 years have passed since last update.

pythonのpixivpyを使用してpixivからうごイラをmp4に変換してダウンロードする（番外編2）

Last updated at 2022-02-21Posted at 2021-01-08

2021/2/21追記　ログイン方法を変えることで動くようになりました！！

記事に従ってプログラムを変更してください。

今のこの記事のプログラムは変更していないので動きません。
自分で直してください。m(__)m

はじめに

@choshicureさんの作った、pixivからうごイラをgifとしてダウンロードするプログラムがあります。

とても使いやすいですが、結構gifが圧縮されてしまい、本物同様のきれいなうごイラは再現できません。
gifについて調べたところ、使用する色の数やディザなど様々な方法で圧縮していることがわかりました。
このことについて詳しく知りたい方は、以下のサイトを見てください。

gifの作成に使用されているPILライブラリを詳しく見ましたが、残念ながら圧縮度合いを変えることはできないみたいです。
そこでOpenCVライブラリを使用してうごイラからmp4動画を作ることにしました。
なお、ffmpegの使用も考えましたが、ダウンロードやpathを通したり大変そうなのでやめました。

注意

pixivpyはおそらく中国の有志が作ったライブラリであり、公式のものではありません。
そのためログイン時のユーザーid、passwordは流出してもいいように捨て垢を使うなどの方法を使うことをお勧めします。

また乱用厳禁です。
スクレイピングのルールとして1秒当たりリクエリは1回までという暗黙のルールがあります。
これがないとdos攻撃となってしまい、法的にアウトです。
sleepをコメントアウトする際は自己責任でお願いします。

また何か問題が起きても自己責任でお願いします。

環境

このプログラムはwindows10環境下で動かしています。
Linux、Mac環境下で動作するかはわかりません。
特に、スラッシュやバックスラッシュの扱いが異なってくるので、どうなるか本堂にわかりません。

ライブラリのインポート

pip install opencv-python
pip install pixivpy

コード

画像をダウンロードするところまでは
@choshicureさんの作った

と同じです。
変数の説明などはこちらの記事を読んでください。

後半のmp4に変換する部分は以下の記事を参考にしました。

ugoira_mp4_downloader.py

from pixivpy3 import *
from  time import sleep
from PIL import Image
import os, glob
import sys
import cv2

# ログイン処理
aapi = AppPixivAPI()

ID = 'YOUR_ID'
PASS = 'YOUR_PASS'

aapi.login(ID, PASS)

# イラストIDの入力待機
illust_id = int(input('>>'))

illust = aapi.illust_detail(illust_id)
ugoira_url = illust.illust.meta_single_page.original_image_url.rsplit('0', 1)
ugoira = aapi.ugoira_metadata(illust_id)
ugoira_frames = len(ugoira.ugoira_metadata.frames)
ugoira_delay = ugoira.ugoira_metadata.frames[0].delay
dir_name = str(illust_id)+'_ugoira'

# うごイラを保存するフォルダの作成
if not os.path.isdir(dir_name):
    os.mkdir(dir_name)


# うごイラに使われているすべての画像のダウンロード
for frame in range(ugoira_frames):
    print(frame)
    frame_url = ugoira_url[0] + str(frame) + ugoira_url[1]
    aapi.download(frame_url, path=dir_name)
    sleep(2) #ダウンロードした後は一応2秒待機

# -------------------------------------------------
# ここからオリジナル

# 動画の作成
frames = glob.glob(f'{dir_name}/*_ugoira*')
frames.sort(key=os.path.getmtime, reverse=False)

# パラメーター
fps = 1000 / ugoira_delay
height = illust.illust.height
width = illust.illust.width



# encoder(for mp4)
fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')
# output file name, encoder, fps, size(fit to image size)
video = cv2.VideoWriter(f'{dir_name}/{illust_id}.mp4',fourcc, fps, (width, height))

for frame in frames:
    img = cv2.imread(frame)
    video.write(img)

video.release()
print('written')

まとめ

gifよりもファイルサイズが小さく、きれいなmp4のうごイラがダウンロードできるようになりました。
しかし、欠点としてmp4は再生するソフトでいろいろ設定しないとループができなかったり、圧縮する以上元のうごイラよりも画像が劣化しているという問題があります。

2022/2/21　追記

色々問題点があったので、修正しました。
具体的には、

OpenCVが全角文字のパスに対応していない
OpenCVで動画を作る際、αチャンネルを含んだpng画像に対応していない
フォルダ内に画像以外があるとエラーになる
画像のソートをダウンロード時間ではなく、数字の大きさ順にした

の3点です。

1. OpenCVが全角文字のパスに対応していない

オリジナルのプログラムでは、プレゼントディレクトリ直下の半角文字のみのフォルダに画像をダウンロードしているため、問題がありません。
しかし、プログラムをいじって保存場所を変えてディレクトリを指定する際に全角文字が入ってしまうと、エラーになってしまいます。
そこで、以下のサイトを参考にNumpyを使用して読み込むことにしました。

2. OpenCVで動画を作る際、αチャンネルを含んだpng画像に対応していない

詳しくは以下の記事に書いています。

要約すると、Numpyを経由したことで、αチャンネルを含んだpng画像がそのまま読み込まれてしまったので、αチャンネルを削除するようにしました。

3. フォルダ内に画像以外があるとエラーになる

うごイラを初めてダウンロードするなら問題がありません。
しかし、ダウンロードしなおしたり、ほかの方法でダウンロードするとき、フォルダ内のファイルをすべて取得する際に、以前作成したhtmlなどが混在しているとエラーになってしまいます。
そこで、画像ファイルのみを取得するようにしました。

4. 画像のソートをダウンロード時間ではなく、数字の大きさ順にした

題名の通りです。
以下のサイトを参考にしました。

プログラム

以上の修正を加えたプログラムが以下になります。