35
38

More than 5 years have passed since last update.

グラフィカルモデリングをまとめてみた。

Last updated at Posted at 2015-11-05

導入

Qiitaでもグラフィカルモデリングを題材とした記事が特にないと思いまして、
グラフィカルモデリングについて軽く概要をまとめてみました。

"いまさら聞けないグラフィカルモデリング入門"
http://www.slideshare.net/Kawamoto_Kazuhiko/ss-35483453

1.グラフィカルモデリングの概要

1) グラフィカルモデリングとは?

ざっくり、ベイズ推論のためのモデルです。

(さらに言うと…)
確率変数間の条件付き独立をグラフで表したものです。
条件付き独立であることがモデリングと効率的なアルゴリズムのポイントです。
(繋がりがあるが、組み合わせ爆発をしない)

2) 潜在変数(隠れ変数)

観測可能である観測変数xに対して、
観測不能である潜在変数zを定義することで、
本来は観測されない値を表現していくことができます。

2.グラフィカルモデリングの種類

1)モデルの種類

マルコフ確率場:無向グラフによるグラフィカルグラフ
ベイジアンネットワーク:有効グラフによるグラフィカルモデリング

-補足-
直観的にはベイジアンネットワークの方が理解しやすいが、
・マルコフ確率場:隣接しているノードを与えればよい
・ベージアンネットワーク:子同士でも依存関係が発生している
ため、条件付き独立であるかどうかの判別が複雑であり、
マルコフ確率場の方がベイジアンネットワークより単純なモデルといえる。

2)潜在変数の種類

マルコフ確率場の潜在変数が、
・離散確率である場合:隠れマルコフモデル
・連続確率である場合:カルマンフィルタ(正規分布)、
           粒子フィルタ(正規分布以外)
です。

グラフがループ構造を持つ場合に、
確率伝搬法(積和アルゴリズム)を用いることで近似解を導出できます。

3.実装

↓解説記事が分かりやすいです。
"Python networkx でマルコフ確率場 / 確率伝搬法を実装する"
http://sinhrks.hatenablog.com/entry/2014/12/27/232506

タイトルの通り、Pythonでnetworkxモジュールを用いた実装を
画像処理を題材に組まれています。

4.まとめ

グラフを用いることで、視覚的なモデリングができることが
グラフィカルモデリングの強みと言われていますが、
実際に強みを発揮させるには、技量が必要と感じます。

Web広告での活用

グラフィカルモデリングと潜在変数の解説を書いたので、
今広告業界で、どのようにグラフィカルモデリングが使われているのか
今流行のネイティブアドでの活用例を、
記事と論文(Yahoo!)を元に書きたいと思います。

1.記事
【連載】インサイトをめぐる冒険(トピックモデルのネイティブ広告への活用)
第五回 コンテンツマーケティングの未来予想図
-潜在興味を追求する冒険は続く-
http://marketing.itmedia.co.jp/mm/articles/1410/02/news001.html

2.論文
論文名:トピックモデルを用いたコンテンツ連動型広告の検索
著者:山本 浩司 野口 正樹 小野 真吾 塚本 浩司 (ヤフー株式会社)
http://www.anlp.jp/proceedings/annual_meeting/2014/pdf_dir/P2-14.pdf

1.記事紹介

1).「Topic Marketing System」における現状の問題

a)Topic解釈精度の向上およびスピードアップ

Topic Modelは、スピーディーかつ容易に文章要約を行うことを可能にしたが、
Topicに含まれる特徴語リストから潜在興味を読み取るには、
予備知識や想像力などの人的アナログ作業が発生するので、改善が必要。

b)Topicからの迅速なコンテンツ生成(文脈構築)

word vec2(Google社が開発し、公開している最先端の自然言語処理技術)を用いる。
※word vec2:文章を単語に分解し、ニューラルネットワークによる
コーパス(辞書)を構築することで、単語のベクトル表現を獲得する手法

c)ネイティブ広告との融合

ネイティブ広告プラットフォームとの融合

2).潜在興味層へのアプローチ方法はどう変化していくか?

a)静的から動的アプローチへ(潜在興味の変化の兆しを先取り)

動的な学習モデルを用いる必要が出てくる。

b)ターゲティングがより高精度に

購買情報のオムニチャネル化や機械学習による行動予測の進化により、
精度の高いターゲティング広告が可能となる。

2.論文紹介

1)前提:

広告選択の基準には、
・コンテンツ内の単語
・広告文中の単語の類似度
がある。
 

2)問題点:

コンテンツに適した広告があっても
コンテンツと広告とで用いられる言葉が異なっていると
広告が表示候補にならない。

3)提案手法:

言葉のミスマッチで適切な広告を表示候補に出来ない問題を解決するため、
ページのコンテンツと広告文の双方の単語をトピックに変換する。
⇒ 変換したトピック空間上で広告を検索する手法を提案した。
 

4)論文の新規性:

単語による検索とトピックによる検索を組み合わせることで、
両者を単独で使う場合よりも広告検索の精度が向上することを示した。

5)補足(自然言語処理とトピックモデル)

・自然言語処理:
スマニューにも使われる「自然言語処理」ってなに?(http://logmi.jp/45207)

・トピックモデル:トピックモデルことはじめ
(https://speakerdeck.com/yamano357/tokyowebmining46th)
を読めば何となく理解できるかと思います。

35
38
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
35
38