データの作成方法について
numpyのrandomを使って、正常データと異常データを作成します。
ここで、正常データと異常データの定義は以下のようになります。
正常データ:データ集合がある範囲に収まっている
異常データ:データ集合がバラバラである
上記を踏まえて、正常データと異常データを作成します。
ライブラリのロード
import pickle
import numpy as np
import random
コード
numpyのrandom.sampleを使い、正常データを作成します。
対して異常データは、1以上の数値を配列に入れることで、作成します。
最後にpickle形式で保存します。
# 正常データ、異常データを生成
normal_data = np.random.rand(1000, 4)
number_lst = list(range(1, 100))
anomaly_data = list()
t_anomaly_data = list()
for i in range(0, 100):
anomaly_data.append(random.sample(number_lst, 4))
anomaly_data = np.array(anomaly_data)
print(normal_data.shape)
print(anomaly_data.shape)
with open('normal_data.pkl', 'wb') as f:
pickle.dump(normal_data, f)
with open('anomaly_data.pkl', 'wb') as f:
pickle.dump(anomaly_data, f)