経緯
クローラーを弾く処理を書いてるときに、 社内アカウントで GoogleHangouts
でリンクを踏むとで異なるUAで2度飛んで来てた
原因
クローラーの判定はwootheeを使ってUAで見てたけど、通常のchromeのように振る舞っていてクローラーとしての判定が効いておらず、またGoogleHangouts
自体、ユーザーがリンクを踏んだ際か2度アクセスが飛んでいるみたい。
あと、通常のユーザー(ドメインが gmail.com
になってるとき)の場合は同一のUAだが、同一GSuite内のドメインだとUAが変わってる。
(Google側でなにか検知でもしてるのかな?)
実際なんでこんな動きをするのかはよくわからない。
ちなみに同一GSuite内のドメインだとこんなUAが刺さってた
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36 Google (+https://developers.google.com/+/web/snippet/)
Google (+https://developers.google.com/+/web/snippet/)
て部分が付加されており、またhostもユーザーのアクセス元のIPとは違うところから飛んで来てる
対策
同一GSuite内のドメイン の場合は、
Google (+https://developers.google.com/+/web/snippet/)
がUAに含まれているので、それを見てやればいけそうだけど、通常のユーザー(ドメインが gmail.com
になってるとき)はUA全く一緒だったから、弾くの難しそうだね・・・