高速なウェブサイト最適化のための KPI 設計手法の提案
背景 / 目的
ユーザーの行動を換気させるウェブサイトを構築するための手法
ex. ABテスト
KPIの長期化問題
広告クリック率, MAU, 検索エンジン順位数など
提案手法
KPIが長期化する要因
- ユーザーの行動頻度要因
- 外部サービス行動頻度要因(メインの要因)
Webサイトのバリエーションをx, ユーザーのフィードバックをyとして
x: ボタンの配置の変更, 色の変更
y: 滞在時間, 直帰率, 離脱率
z: 外部サービスによるモニタリング結果
y → z
を予測する関数を形成できれば代替KPIを設計することが可能
実験
実際のWebサイトに広告クリックに最適化する実験を実施
最適化アルゴリズムは, ε-greedy
外部サービスによるKPIよりも速く最適化できる
段階的詳細化能力とプログラミング学習の関係に関する研究
段階的詳細化能力
段階を踏んで, 抽象的な内容から具体的な内容に変換する能力
プログラムの概要から具体的なプログラムの詳細に落としこむ能力
実験
プログラミングのグループ学習
ビデオ再映をして会話文を文字起こしする
+PISAによる国語力, 問題解決能力, 段階的詳細化能力テスト
会話量, プログラムに関する会話量(会話主題量)とプログラミングテスト結果を相関分析
会話量が多いかつ会話主題量が多いほどプログラミングテストの結果がよい
未経験者
プログラミング * 段階的 * 問題解決能力に相関が見られた
経験者
段階的 * 問題解決能力に相関が見られた
メタ認知による影響ではないか?
検索連動型広告におけるテキスト自動生成とその評価指標の検討
目的
検索連動型広告のTD(Title & Description)を自動生成したい
人が考えるテキストと同等の効果を持つTDの生成
TDにおける制限 / 重要点
- Title15文字, Description38文字の制限
- 目につきやすい, 惹きつける文書
- ユーザーに飽きられないようにできるだけ多くの種類を用意する
提案手法
入力文書から重要文書を抽出する
入力文書=広告主のアプリストアへの説明文
- 文書同士の単語の頻度(or tf-idf)から類似度を計算
- 閾値を設定し, 類似度からネットワークを形成
- 接続エッジ数が多い文を重要文書とする
Wikipedia文書をword2vecに食わせる
重要文書内の名詞をword2vecで抽出した類似語に入れ替える
Title部分の抽出
- ルールベースの抽出
- 体言止めへの変換
実験
GoogleAdwordsで実施
広告主A: 2週間
広告主B: 1週間
CTRと有効率(人力判断)でテスト
既存の人力のTDとほぼ同等のCTR
tdidfを使ったほうが有効率, CTRが高い
word2vecを使うと無駄な文が生成されすぎて有効数は上がるが, 有効率は下がる
嗜好の類似性に着目したソーシャルネットワーク影響力分析
背景 / 目的
SNSにおけるインフルエンサの存在
情報配信先の嗜好に基づいた情報伝播モデルの提案
手法
k-meansで各ユーザーをクラスタリング
嗜好ベクトルを利用し情報の影響力が最大のクラスタを選択
情報配信の上限になるまでそのクラスタから影響力が高いノードを選択していく
嗜好ベクトルは始めの情報の配信でのみ使われている
スマートフォンにおけるコンテンツ閲覧と共有行動の分析
Gunosy × 東京大学
背景 / 目的
バイラルメディアの成長
既存のメディアもバイラルメディア的戦略を取り入れている
共有行動の背景の閲覧に対してはあまり研究が行われていない
ユーザーの閲覧情報と共有情報を分析する
データ
85%ほどが閲覧, 残り15%ほどが共有
共有のうち, 30%は閲覧なしで起こる
トピックによる分析
tf-idfで重み付けした文書をLSIで次元圧縮
トピック数は300
最も大きいトピックが文書数の5%以下になる用に設定
Description | 該当トピック |
---|---|
シェア率上位 | 自然科学 音楽 健康 デザイン |
シェア率下位 | 恋愛 炎上ネタ |
閲覧なしシェア率上位 | 野球 アニメ ソシャゲ 医療 働き方 |
閲覧なしのシャア率下位 | 仕事 おもしろ画像 労働問題 ベンチャー 教育 |
アニメや恋愛記事の閲覧は多いが, シェアは少ない
ユーザーは記事を閲覧し, 記事の内容によってシェアするかどうかきちんと判断している
ユーザーの期待する反応に応じたツイート分類
背景 / 目的
SNS疲れが近年よく言われている
意図と解釈のずれ・誹謗中傷(フィルタリングで解決できる)
ex. 経緯の欠如, マジレス
ズレをシステムで検知してフィルタリングすることを目的
提案手法
期待する行動を定義して機械学習で分類
無反応, RT, Fav, RT+Fav
機械学習モデル
SVM + Bi-Normal Separation(特徴選択)
素性
N-gram(N=1,2,3)