2つの epub ファイルの比較判定 (true/false) を行うコマンドラインツールを作ってみました。
https://github.com/katoy/compare_epub
作成日付けとか、 内部の ID 値の差は無視して、比較を行います。
(ソースコードを変更すれば、比較対象から外す項目は目的にあわせて調整可能。)
コンソールには 一致判定結果の true/false だけを出力します。
しかし ./work-diff/ 以下には 2 つの epub を zip 展開した結果と、それらをフィアル毎の nokogiri-diff での比較結果を出力しています。
なお、動作チェック用の epub は pandoc (http://johnmacfarlane.net/pandoc/demos.html) をつかって作成しました。
また、生成した epub は epubcheck (https://github.com/IDPF/epubcheck) でのチェックをパスすることを確認しています。
ここでつかった方法は、docx のように xml ファイルが zip 化されているデータについては、そのまま応用が可能なはず。