#Word2Vec-Python実装の概要解説
##Word2Vecとは
深層学習を使用し、単語をベクトルに変換するアルゴリズムです。
■入力:単語
■Word2Vec
■出力:配列(50次元)
##白ヤギが作った日本語Word2Vecモデル
Word2Vecを使用し単語をベクトルに変換するためには、事前にWord2Vecの深層学習の重みの学習を完了させておく必要があります。
「word2vec.gensim.model」、「word2vec.gensim.model.syn1neg.npy」、「word2vec.gensim.model.wv.syn0.npy」は白ヤギコーポレーションがPython用ライブラリGensimに用意されているword2vecを実装し、学習を完了させた深層学習の重みデータを使用するためのファイルです。
##白ヤギが作った日本語word2vecモデルのインストールから実装
①データを取り込む
http://public.shiroyagi.s3.amazonaws.com/latest-ja-word2vec-gensim-model.zip
上記のファイルをダウンロード、解凍します。
②ファイルを格納
下記の3ファイルを格納します。
・word2vec.gensim.model
・word2vec.gensim.model.syn1neg.npy
・word2vec.gensim.model.wv.syn0.npy
③Word2Vecの実装
「
:pythonを使用したWord2Vecの実装
#Word2Vecをインポートする
from gensim.models.word2vec import Word2Vec
#Word2Vecで使用するデータのパス指定
model_path = './word2vec.gensim.model
#モデルのロード
w2v_model = Word2Vec.load(model_path)
#単語をベクトルに変換
w2v_model[u'単語']
#参考文献
[1]岡谷貴之,深層学習,2015 講談社サイエンティフィク, 講談社.
[2]word2vecの学習済み日本語モデルを公開します-https://aial.shiroyagi.co.jp/2017/02/japanese-word2vec-model-builder/
[3]15分でできる日本語Word2Vec - Qiita