広告機械学習最前線
第54回 データマイニング+WEB @東京( #TokyoWebmining 54th ) ー深層学習・機械学習 祭りー のセッション「広告機械学習最前線」のメモです。
(後で詳しく調べるようにメモしているので、内容はちょっと雑になっています)
Masa_s3 さんによる発表資料は こちら。
概要
-
入札ロジックの話がメインになる
- CTR / CVR 予測モデル
- 予算消化コントローラ
- 入札価格決定関数
-
今回の発表は Real Time Bid Optimization with Smooth Budget Delivery in Online Advertising を基にしている
- CTR / CVR 予測器や入札金額調整がどのように DSP に組み込まれるのか、そのフレームワークを提案している

DSP の内部の話
アドリクエストの処理
- アドリクエストを受ける
- CTR 予測
- 入札価格を決定する 8(pacing)
- 入札する (レスポンス)
データ構造
- Advertiser
- Campaign
- Ad group
- Campaign
- Campaign では、一日の予算上限を管理する
- Ad group では、入札価格を管理する
広告 (キャンペーン) を選ぶ
- 選ぶ基準
- 予測 CTR、予測 CVR が高いか?
- 予算消化状況はどうか?
入札金額を決定する
- 入札金額
- 予測 CTR、CVR、消化状況、CPA を総合評価して決定する
- 他社の入札に負けないようにしなければならない
- 複雑なロジックを使って高精度な計算をしたいが、時間の制約 (50ms or die) がある
CTR / CVR 予測モデル
- クリックやコンバージョンしてくれるユーザを予測する
- 歴史的に、ロジスティック回帰 (とその派生) がよく使われている
- より高精度な予測をするならば、Factorization Machines (FM) + Follow the regularized leader (FTRL) などがある
- FTRL は Ad Click Prediction: a View from the Trenches の論文が詳しい
- 特徴ベクトルの次元
- CTR 予測での特徴ベクトルは典型的には 2^24 次元、次元削減しないと 2^27 次元になるので、交互作用を考えるのは辛い
- FM であれば、そんなに辛くない
予算消化コントローラ
- 広告主としては、
- なるべく安く「獲得」したい
- なるべく滑らかに (各時間帯にまんべんなく) 配信したい
- 素朴な配信スムージング
- AdWords and Generalized On-line Matching
- AdWords problem (online matching) の問題としてスムージングを実現する
- 紹介するロジック
- Smart Pacing for Effective Online Ad Campaign Optimization
- キャンペーンごとに「レイヤ」という概念を定義する
- レイヤごとにペーシングレートを計算する
- このペーシングレートが高いものほど出やすくなる
- リクエストの品質 (CVR とか) ごとに、「レイヤ」を決める
入札価格決定関数
-
Bid Optimizing and Inventory Scoring in Targeted Online Advertising
- 平均予測 CTR より高いリクエストには高めに入札する
- 逆に予測 CTR が低い場合は入札を控える
- 0.8, 1.0, 1.2 みたいな係数をかける
- CVR 向上には効くが、CPA 最適化はあんまり期待できない