LoginSignup
2
5

More than 5 years have passed since last update.

Word2Vec+LSTMでSNLIデータセットのクラス分類

Last updated at Posted at 2017-08-23

与えられた2つの文章が前提と仮説の関係になっているかクラス分類するデータセットとしてSNLIがあります.
この問題を解くために学習済みのWord2Vec1とLSTMを組み合わせたモデルをKerasで実装してみたという内容です.

SNLI2データセットの詳細については記事「SNLIデータセットの読み込み方3に記載しています.
参考になれば幸いです.

前準備

SNLIデータセットのダウンロード

The Stanford Natural Language Inference (SNLI) Corpusよりダウンロードできます.

wget https://nlp.stanford.edu/projects/snli/snli_1.0.zip
unzip snli_1.0.zip

学習済みWord2Vecの重みのダウンロード

Google Newsによって学習済みのWord2Vecの重みは下記サイト1のリンク"GoogleNews-vectors-negative300.bin.gz"からダウンロードできます.

実装

学習済みWord2VecとLSTMを組み合わせたモデルをSNLIデータセットで学習を行うコード4です.記事5が参考になります.

実験結果

  • Train: 82.01%
  • Valid: 80.12%
  • epoch数: 18

となり,既存の300D LSTM6と同程度の性能が出せていることが確認できます.
ここから更に性能を上げるためにDecomposable Attention7 8やESIM9 10が使えたりします.

References

2
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
5