はじめに
画像をスクレイピングしていると、たまに通信エラーで途中までしかダウンロードされず、変な画像になっていることがある。
破損した画像ファイルを修復するソフトはたくさん出てきたが、
破損しているかどうかを見つけるソフトがぱっと出てこなかったので
BadPeggyというソフトを紹介する
環境
windows10
Ryzen 3700x
WD Blue™ SN550 NVMe™ SSD(1TB)
注意
このソフトはおそらく有志が作成したソフトです。
使用するにあたり、自己責任でお願いします。
参考サイト
機械で日本語訳された外国のフォーラムらしい
が、これに載っていたBadPeggyというソフトがとても使いやすかったので紹介する。
このサイトにWindows、Linux、およびOS Xのダウンローダーが、
こちらにソースコードがあるらしい(未確認)
ダウンロード方法
まず
こちらのサイトに行き、
この赤丸の部分のうち自分の環境にあったところをクリック
すると
badpeggy23_windows.zip
というものがダウンロードされる。
一応ウイルスチェックをして、展開する。
すると
このようなファイルをが出てくるので、どこか適切な位置に移動させる。
もちろんこのままでもいい
これを開くとこのような中身になっているので、
readme.txtを開くと、
INSTALLATION
Windows
Run the file "install.vbs" to create a shortcut on the desktop. It points to
the installation directory, thus will become invalid if moved or deleted.
Linux
Extract the archive to the location of your choice. Open a terminal and go
into that folder, then type "./install.sh", enter your password (sudo rights
required). Once installed the app icon should be available. You can remove
the extracted portion, because the actual installation ends up in the "/opt"
folder, from which you can then call the "./uninstall.sh" script to remove
everything.
とあるので
install.vbs
をダブルクリックすると
と出てきて、
無事ショートカットがデスクトップにできている
これで使えるようになった。
使用方法
ショートカットをクリックすると
と出てくるので無難にEnglishを選択しておく
スキャン方法として、
1.画像の入ったフォルダをドラックアンドドロップ
2.File > Scanからフォルダを指定
これで実行できる。
サブフォルダーも含まれます。
なお、初期状態で
Option > use all cpu cores
にチェックが入っているので、多くの画像が入っているフォルダを指定するとこのようにcpu使用率が100%になってしまうので注意
300MB/秒越え!!
まさか8コア16スレッドのCPU Ryzen 3700Xがボトルネックになる日が来るとは...
Ryzen 5950Xでも買おうかな
もっと詳しく知りたい人向け
このサイトが比較とかをしているみたいです(英語)
まとめ
今回は画像が破損しているかどうかを探してくれるBadPeggyの使用方法を紹介した。
結構簡単に使用できるソフトなのでぜひ使ってみてほしい。
余談
こちらのプログラムで集めた画像がちゃんとダウンロードされているか確認するのに使っています。