More than 5 years have passed since last update.

株式会社mikan

JSAI2015 3日目 2015.06.01(月)

Posted at 2015-06-01

高速なウェブサイト最適化のための KPI 設計手法の提案

背景 / 目的

ユーザーの行動を換気させるウェブサイトを構築するための手法
ex. ABテスト

KPIの長期化問題
広告クリック率, MAU, 検索エンジン順位数など

提案手法

KPIが長期化する要因

ユーザーの行動頻度要因
外部サービス行動頻度要因（メインの要因）

Webサイトのバリエーションをx, ユーザーのフィードバックをyとして
x: ボタンの配置の変更, 色の変更
y: 滞在時間, 直帰率, 離脱率
z: 外部サービスによるモニタリング結果

y → z
を予測する関数を形成できれば代替KPIを設計することが可能

実験

実際のWebサイトに広告クリックに最適化する実験を実施
最適化アルゴリズムは, ε-greedy
外部サービスによるKPIよりも速く最適化できる

段階的詳細化能力とプログラミング学習の関係に関する研究

段階的詳細化能力

段階を踏んで, 抽象的な内容から具体的な内容に変換する能力
プログラムの概要から具体的なプログラムの詳細に落としこむ能力

実験

プログラミングのグループ学習
ビデオ再映をして会話文を文字起こしする
＋PISAによる国語力, 問題解決能力, 段階的詳細化能力テスト

会話量, プログラムに関する会話量（会話主題量）とプログラミングテスト結果を相関分析
会話量が多いかつ会話主題量が多いほどプログラミングテストの結果がよい

未経験者
プログラミング * 段階的 * 問題解決能力に相関が見られた

経験者
段階的 * 問題解決能力に相関が見られた
メタ認知による影響ではないか？

検索連動型広告におけるテキスト自動生成とその評価指標の検討

目的

検索連動型広告のTD（Title & Description）を自動生成したい
人が考えるテキストと同等の効果を持つTDの生成

TDにおける制限 / 重要点

Title15文字, Description38文字の制限
目につきやすい, 惹きつける文書
ユーザーに飽きられないようにできるだけ多くの種類を用意する

提案手法

入力文書から重要文書を抽出する
入力文書＝広告主のアプリストアへの説明文

文書同士の単語の頻度（or tf-idf）から類似度を計算
閾値を設定し, 類似度からネットワークを形成
接続エッジ数が多い文を重要文書とする

Wikipedia文書をword2vecに食わせる
重要文書内の名詞をword2vecで抽出した類似語に入れ替える

Title部分の抽出

ルールベースの抽出
体言止めへの変換

実験

GoogleAdwordsで実施
広告主A: 2週間
広告主B: 1週間

CTRと有効率（人力判断）でテスト

既存の人力のTDとほぼ同等のCTR
tdidfを使ったほうが有効率, CTRが高い
word2vecを使うと無駄な文が生成されすぎて有効数は上がるが, 有効率は下がる

嗜好の類似性に着目したソーシャルネットワーク影響力分析

背景 / 目的

SNSにおけるインフルエンサの存在
情報配信先の嗜好に基づいた情報伝播モデルの提案

手法

k-meansで各ユーザーをクラスタリング
嗜好ベクトルを利用し情報の影響力が最大のクラスタを選択
情報配信の上限になるまでそのクラスタから影響力が高いノードを選択していく

嗜好ベクトルは始めの情報の配信でのみ使われている

スマートフォンにおけるコンテンツ閲覧と共有行動の分析

Gunosy × 東京大学

背景 / 目的

バイラルメディアの成長
既存のメディアもバイラルメディア的戦略を取り入れている

共有行動の背景の閲覧に対してはあまり研究が行われていない
ユーザーの閲覧情報と共有情報を分析する

データ

85%ほどが閲覧, 残り15%ほどが共有
共有のうち, 30%は閲覧なしで起こる

トピックによる分析

tf-idfで重み付けした文書をLSIで次元圧縮
トピック数は300
最も大きいトピックが文書数の5%以下になる用に設定

Description	該当トピック
シェア率上位	自然科学音楽健康デザイン
シェア率下位	恋愛炎上ネタ
閲覧なしシェア率上位	野球アニメソシャゲ医療働き方
閲覧なしのシャア率下位	仕事おもしろ画像労働問題ベンチャー教育

アニメや恋愛記事の閲覧は多いが, シェアは少ない
ユーザーは記事を閲覧し, 記事の内容によってシェアするかどうかきちんと判断している

ユーザーの期待する反応に応じたツイート分類

背景 / 目的

SNS疲れが近年よく言われている
意図と解釈のずれ・誹謗中傷（フィルタリングで解決できる）
ex. 経緯の欠如, マジレス
ズレをシステムで検知してフィルタリングすることを目的

提案手法

期待する行動を定義して機械学習で分類
無反応, RT, Fav, RT+Fav

機械学習モデル
SVM + Bi-Normal Separation（特徴選択）

素性
N-gram（N=1,2,3）

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up