2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Word2Vec-Python実装

Posted at

#Word2Vec-Python実装の概要解説

##Word2Vecとは
深層学習を使用し、単語をベクトルに変換するアルゴリズムです。

■入力:単語
■Word2Vec
■出力:配列(50次元)

##白ヤギが作った日本語Word2Vecモデル
Word2Vecを使用し単語をベクトルに変換するためには、事前にWord2Vecの深層学習の重みの学習を完了させておく必要があります。
「word2vec.gensim.model」、「word2vec.gensim.model.syn1neg.npy」、「word2vec.gensim.model.wv.syn0.npy」は白ヤギコーポレーションがPython用ライブラリGensimに用意されているword2vecを実装し、学習を完了させた深層学習の重みデータを使用するためのファイルです。

##白ヤギが作った日本語word2vecモデルのインストールから実装
①データを取り込む
http://public.shiroyagi.s3.amazonaws.com/latest-ja-word2vec-gensim-model.zip
上記のファイルをダウンロード、解凍します。

②ファイルを格納
下記の3ファイルを格納します。
・word2vec.gensim.model
・word2vec.gensim.model.syn1neg.npy
・word2vec.gensim.model.wv.syn0.npy

③Word2Vecの実装

:pythonを使用したWord2Vecの実装
#Word2Vecをインポートする
from gensim.models.word2vec import Word2Vec

#Word2Vecで使用するデータのパス指定
model_path = './word2vec.gensim.model
#モデルのロード
w2v_model = Word2Vec.load(model_path)
#単語をベクトルに変換
w2v_model[u'単語']


#参考文献
[1]岡谷貴之,深層学習,2015 講談社サイエンティフィク, 講談社.

[2]word2vecの学習済み日本語モデルを公開します-https://aial.shiroyagi.co.jp/2017/02/japanese-word2vec-model-builder/

[3]15分でできる日本語Word2Vec - Qiita
2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?