Geminiで生成した画像をダウンロードすると、右下に自動的に追加されるウォーターマーク。
品質は高いのに、この小さなロゴのせいでそのまま使えない場面も多いと思います。
そこで私は、Chrome拡張「Gemini Watermark Cleaner」 と https://geminiwatermarkcleaner.com/ja
オンライン版 Gemini Watermark Remover を開発しました。https://geminiwatermarkcleaner.com/ja/gemini-watermark-remover.html
本記事では、
• 初期の OpenCV ベース実装
• LaMa ローカルモデルの導入
• 現在の超軽量・高速アルゴリズム
までの 技術的な進化プロセスを紹介します。
⸻
🎥 デモ動画
まずは実際の動作を見ていただくのが一番早いです。
▶️ YouTube デモ動画
https://www.youtube.com/watch?v=EjOyYThugGQ
ダウンロード時に自動でウォーターマークが消える様子が確認できます。
⸻
🔰 開発のきっかけ
Gemini で生成した画像(通常画像 / Nano Banana Images)には必ずウォーターマークが付与されます。
私の目的はシンプルです。
• ユーザーの操作を変えず
• ダウンロード時に自動で除去
• 画像はローカル処理のみ(プライバシー重視)
「意識しなくても勝手に消えている」体験を目指しました。
⸻
🧪 フェーズ1:OpenCV ベース(v1.1.0)
最初に試したのは、OpenCV を使ったシンプルな画像処理です。
参考実装:
https://geminiwatermarkcleaner.com/changelog/v1-1-0.html
手法
• ウォーターマーク位置を固定領域で検出
• 単色背景前提で inpainting / 塗りつぶし
問題点
• 背景が単色なら問題なし
• しかし:
❌ グラデーション
❌ 写真
❌ 色数の多い画像
では境界が目立つ・破綻するケースが多発。
実用性は限定的でした。
⸻
🤖 フェーズ2:LaMa ローカルモデル(v2.0.0)
次に導入したのが、LaMa Inpainting モデルです。
参考:
https://geminiwatermarkcleaner.com/changelog/v2-0-0.html
技術構成
• PyTorch + LaMa
• 完全ローカル推論
• セマンティック補完による自然な復元
精度
• ほぼすべての画像で成功
• 複雑な背景・人物・写真も高品質
• 失敗例はほぼなし
しかし…
最大の問題は処理時間とサイズでした。
項目 値
モデルサイズ 数百MB
1枚の処理時間 約 30 秒
Chrome拡張 現実的でない
「精度は完璧、でも実用性がない」という状態。
⸻
⚡ フェーズ3:軽量アルゴリズム(v3.0.0 / 現行)
最終的に到達したのが、完全自作の軽量アルゴリズムです。
参考:
https://geminiwatermarkcleaner.com/changelog/v3-0-0.html
特徴
• モデル非依存(学習モデルなし)
• JS / WASM 実装可能
• ファイルサイズ < 2MB
• 処理時間:数ミリ秒
アプローチ(概要)
• ウォーターマークの形状・アルファ構造を解析
• エッジ検出 + 局所パッチ再構成
• 周辺ピクセルから統計的補完
• 境界ブレンド処理
これにより:
• 高速
• 高精度
• 拡張機能に完全組み込み可能
という理想的な構成になりました。
⸻
🧩 Chrome 拡張:Gemini Watermark Cleaner
現在の Chrome 拡張は次のように動作します。
仕組み
1. ユーザーが通常通り「ダウンロード」
2. 拡張が chrome.downloads フック
3. 画像をローカル処理
4. ウォーターマークを除去して保存
ポイント
• 操作は今までと完全に同じ
• UI なし
• 処理はすべてローカル
• 画像は外部送信されない
プラグインの存在を意識することはほぼありません。
⸻
🌐 オンライン版:Gemini Watermark Remover
拡張を使えない環境向けに、オンライン版も提供しています。
🔗
https://geminiwatermarkcleaner.com/ja/gemini-watermark-remover.html
特徴
• フリーミアム
• ブラウザ内ローカル処理
• サーバー保存なし
• Nano Banana 画像対応
⸻
🔐 プライバシー設計
拡張版・オンライン版ともに共通ポリシー:
• 画像はすべてローカル処理
• サーバーへの自動アップロードなし
• ログ保存なし
• AI API 未使用
生成画像の機密性をそのまま維持できます。
⸻
🏁 まとめ
開発は次のように進化しました。
フェーズ 技術 精度 速度 実用性
v1 OpenCV 低〜中 高速 △
v2 LaMa 非常に高 遅い ✗
v3 自作アルゴリズム 高 超高速 ◎
現在の実装は:
• 高精度
• 超高速
• 軽量
• 完全ローカル
という、実運用向けの最適解になっています。
⸻
もし Gemini 画像を日常的に扱う方には、かなり便利なツールだと思います。
フィードバックや技術的な議論も歓迎です。
Happy hacking 🚀
