LoginSignup
1
2

More than 5 years have passed since last update.

[Survey] Kaggle - Quora 7位解法まとめ

Posted at

Kaggle - Quora Question Pairs1の7位解法2の調査記事です.

Title: [7位] 7-th solution overview
Author: aphex34
Discussion URL: https://www.kaggle.com/c/quora-question-pairs/discussion/34697

モデル構造

  • 下記方式1〜5の予測結果(sigmoid)を特徴量としてXGBoostで予測
  • 10-fold cvでout-of-fold prediction

方式1.

  • Reccurent Highway Network3
  • 双方向LSTM
  • Siamese-Net4
  • GloVe 840Bで分散表現
  • 89.1%の正答率

方式2.

  • 方式1と基本同じだが,文字単位で適用
  • 単語使わなくても方式1より1%程度性能が悪化するだけだった

方式3.

  • 方式1と基本同じで,3-gramを利用

方式4.

  • Decomposable Attention5を利用.
  • かなり高速に収束(方式1は収束に2時間,こちらは20分程度)
  • 異なるカーネルサイズで実験(論文3版, [2,3]版, [2,3,5]版)

方式5.

  • 方式1〜4と同じだが,Attention Mechanismを利用していない.

自然言語処理(教師なしNLP特徴量)

  • Abhishek6, Mephistopheles7, the1owl8によるカーネル
  • WordNetの類似性9
  • GloVe840BでWord Mover's Distance10を算出
  • NERベースとPOSベースの特徴量(Stanford CoreNLPでタグを入手)

グラフ構造

  • 上位陣と同じ

最適化

  • binary crossentropyのかわりにcontrastive lossを利用.

その他の工夫

  • Pseudo Labeling

    • 最良のモデルを利用してテストセットを予測
    • (train+test) x (train+test)のスパース正方行列$A$を構築
    • 重複確率が閾値以上の全てのペアに対して,スパース正方行列$A$の対応する要素に1を挿入
    • trainとtestの各ペアについてコサイン類似度を算出
  • 予測値をそれぞれ1e-5と1-1e-5でクリッピング

  • ストップワードなし版は性能が落ちたので除外.

References

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2