この記事は、今日の学習において、個人的にわからなかったところを復習していくだけです。私のための記事であることはご了承ください。
make_blobs
クラスタリングのサンプルデータ生成にmake_blobsを使いました。まずは、make_blobsの動作を見てみます。
from sklearn.datasets import make_blobs
x,y = make_blobs(random_state=0)
# 出力
x
# [[ 2.632 0.689]
[ 0.081 4.691]
[ 3.003 0.743]
[-0.638 4.091]...
# 100行、2列の二次元配列
y
# [1 0 1 0 0 0...
# 要素が100個の配列
make_blobsは、上記の通り100行2列のndarray型の配列と100個の要素を持つndarray型の配列を生成してくれます。make_blobsの引数であるrandom_stateは、擬似乱数のシード値を固定するために使われます。擬似乱数のシード値に関してはこちらをご覧ください。