Posted at

dictをarrayに変換

More than 5 years have passed since last update.

特徴量をdictで持っている時に、scipyとかscikit-learnで使うようなarray形式のベクトルにしたい時

from sklearn.feature_extraction import DictVectorizer

features = [{"poko":2, "hoge":1}, {"hoge":2, "pokopoko":10}, {"poko":5, "hogehoge":1}]
vec = DictVectorizer()
array_vectors = vec.fit_transform(features).toarray()

でいける。特徴量のラベルを見たい時は

vec.get_feature_names()