画像認識で CAPTCHA を突破するという人工知能ベンチャー Vicarious が雑誌 Science に発表した件です。
概要
日本語のニュース記事は http://www.itmedia.co.jp/news/articles/1710/27/news112.html がちゃんと解説しています。CAPTCHA を突破できるというのは無数に論文や研究があるのですが(だから CAPTCHA は無意味とも言われます)、Vicarious は Recursive Cortical Network (RCN) というモデルを作っており、この件が論文の主題です。ディープラーニング(畳み込みニューラルネットワーク)とは異なり、長所は少ないデータ量でも学習できるよと。確率モデル(生成モデル)です。CAPTCHA は無数にバリエーションが作られますが、それを少ないデータ量で学習させたかったようで、それで CAPTCHA を選んだみたいです。
リンク集
- Scienceの論文
- http://science.sciencemag.org/content/early/2017/10/26/science.aag2612.full
- これは概要だけで、詳細は Supplementary Materials に書かれています。
- 技術の詳細(Supplementary Materials)73ページ
- 企業側のブログ
- 実装されたソースコード
- https://github.com/vicariousinc/science_rcn
- NumPy で CPU 用に実装されています。コードは短いです。