Google アナリティクスが、2018年5月25日以降、EUの一般データ保護規則に対応するために、データ (Cookie、ユーザーの識別子(例: ユーザー ID)、広告 IDに関連付けられたユーザー単位やイベント単位のデータが対象。)を自動的に削除する仕組みを導入しますね。
つまりは、Google アナリティクスサービスの利用者自身が、ユーザデータをいつまで必要か考えて保存期間を決めなさいよってことですよね。責任が利用者に移って来た。
その時に、選べる保存期間の選択肢。14ヶ月、26ヶ月、38ヶ月、50ヶ月、自動的に期限切れにならない、の5つ。
なんで、12ヶ月きっかりじゃないんでしょうね、って話をします。
14,26,38,50
14ヶ月、26ヶ月、38ヶ月、50ヶ月って数値は何を根拠にしているんでしょう。
年+2ヶ月だろうとは思うのですが、どこにも示されていないんですよね。
なので、ここから先は全部想像です。
年+2ヶ月だとしたら、どうして +2ヶ月 しているんでしょう。
12ヶ月だとダメなんですか?
選択肢は 自動的にデータが削除されるまでの保持期間
です。
データの保持期間が終了すると、月単位で自動的に削除されます。
と説明があります。
保持期間
ってどういう計算なんでしょうね。
たとえばデータの保持期間を1ヶ月だとしたときに、8/10 13:00 のデータはいつ保持期間を終了するのでしょう? 9/10 12:59 でしょうか 9/9 23:59 でしょうか、8/31 23:59 でしょうか、それとも一月おまけして 9/30 23:59 でしょうか。それはつまり、Google は保持期間を秒、分、時、日、月のどこで切り捨てているかという話です。まあ、今は知りようがないわけですが。
いずれにしても、一番短いのは月単位で切り捨てでしょう。8月のデータは8月末までで1ヶ月。もし9月末までにおまけしちゃうと、データの保持期間を1ヶ月と言っておきながら1ヶ月以上保持していることになり法的に訴えられた時に戦いにくい。
というわけで、最も短くなる月単位で切り捨てのケースで、この先考えていきます。
8月のデータは翌年の7月末で12ヶ月。削除されるのは翌8月。
X月のデータが削除されるのは翌年のX月。
わかりやすい。
しかし、Google の月単位の削除処理をいつやったとしても、丸一年保持されないデータが発生してしまう。
サービス利用者は丸一年分のデータが得られないなら、年単位でのデータ処理がしにくく困ります。
伸ばしましょう。
13ヶ月じゃダメなんですか?
13ヶ月だと、
X月のデータが削除されるのは翌年のX+1月。
データは確実に丸一年保持されるようになりますね。やったぜ。
でも、僕らはたとえばバッチ処理などで毎月年間データの集計をしたりするわけです。
1ヶ月のあいだで集計のタイミングが運悪くデータ削除のタイミングよりもあとになると、集計時点では11ヶ月分のデータしか読めないわけです。
Google の月単位の削除処理は何日に行われるのでしょう?情報開示されていないですよね。
うまく集計できたり、集計できなかったりするわけです。話にならない。
伸ばしましょう。
14ヶ月
14ヶ月だと、
X月のデータが削除されるのは翌年のX+2月。
これなら、Google が月単位の削除処理をいつ行おうと、僕らの毎月の年単位でのデータ集計処理はいつでも行えます。
データの保持期間
の定義を一番短い方で考えても問題ないのだから、Googleがデータの保持期間をどのように定義していようと、問題はおきません。
サービスの利用者は、データの保持期間
の定義も、Google が削除処理をいつ行うのかも、全く知る必要がないわけです。
まとめ
というわけで、僕の考えは、
詳しい内部仕様を開示しなくても多くのユーザが困らなくなるので +2ヶ月している。です。
システム開発をしていて、過去データの削除処理を設計する時に、気軽に前年同月で削除するひとのなんと多いことか。まあ、トラブって修正するわけですが。基本 +1ヶ月。他の年次処理の影響を無視できるようにするなら +2ヶ月しましょうね。