gensimの
gensim.models.word2vec.Word2Vec
gensim.models.word2vec.Doc2Vec
の中のtrain関数のみをkeras+Theanoで実装しなおしてGPUでも動くようにした
word2vec-keras-in-gensim
train以外はgensimとまったく同じなので
python
import gensim.models.word2vec
from word2veckeras.word2veckeras import Word2VecKeras
vsk = Word2VecKeras(gensim.models.word2vec.LineSentence('test.txt'),iter=100)
print( vsk.most_similar('the', topn=5))
のような感じで使える.
インストールは
bash
pip install word2veckeras
本体ファイルは
word2veckeras.py
doc2veckeras.py
で,それぞれの
python
if __name__ == "__main__":
の下やdoctestに使用例が書いてある.
word2vecをkerasで実装した結果,簡単に改造できるようなった.例として追加情報の同時学習をする改造を置いている