特徴量をdictで持っている時に、scipyとかscikit-learnで使うようなarray形式のベクトルにしたい時
from sklearn.feature_extraction import DictVectorizer
features = [{"poko":2, "hoge":1}, {"hoge":2, "pokopoko":10}, {"poko":5, "hogehoge":1}]
vec = DictVectorizer()
array_vectors = vec.fit_transform(features).toarray()
でいける。特徴量のラベルを見たい時は
vec.get_feature_names()
で