学校で学んだところの復習を兼ねてデータ分析で用いられているPythonのコードなどについてまとめようと思います。
今回は基本的なことを中心にまとめていきたいと思います。(何回で終わるのかは未定。)
#0-0 実行環境
Jupyter-Notebook (https://jupyter.org/)
Numpyをインストールしておく
#0-1 ファイル読み込み
授業では全てcsvファイル(エクセルファイル)にデータが格納されていました。その読み取りのコードは,
import numpy as np
array=np.loadtxt(fname="(ファイル名)",delimiter=".")
//ファイル名は~~.csvまで書きましょう。//
読み込んだデータは行列の構造をしています。データの位置はエクセルと同じような構造をしています。0列目にエクセルの最初の行があります。
またファイルが読み込めない!と言うときはファイルがある階層でやっているかどうかを確認しましょう。例えばドキュメントにファイルがあるならJupyter-notebookを開いてドキュメントをクリックし, そこで試してみてください。
#0-2 スライス
上の方法で得たデータはarray配列です。データには説明変数と結果の二つが格納されています。これを分離する作業です。
先ほども言ったように, 得たデータ配列にはエクセルと同じ順番・構造でデータが入っています。これを列ごと(縦)に分けます。
array_x=array[:,j] j列目を取得
array_x=array[:,j:] j列目から最後の列まで取得
初回なのでこのくらいで終わります。さいなら―