LoginSignup
0
0

More than 5 years have passed since last update.

Opinion Spamの判定に使えそうな特徴量

Last updated at Posted at 2016-06-11

Opinion Spam(レビューサイトにおける業者のステマ行為のこと)の対策方法を調べているのだけれど、手動だと膨大な手間がかかるので機械学習を使ってなんとか自動でOpinion Spamを検出したい。
ググっていたらこの発表資料に書いてある特徴量一覧がよさ気だったのでメモ。

  • レビューの言語的内容
  • レビュアーのメタデータ
    • スターレーティング
    • ユーザーID
    • レビュー投稿時間
    • レビューを書いて投稿するのに要した時間
    • IPアドレスとMACアドレス
    • レビュアーの地理位置情報
  • 製品情報
    • プロダクトの説明文
    • 販売量
    • 売上ランキング
  • サイト内にある内部的情報は有用、しかし部外者が手に入れることは困難
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0