機械学習について少し学びたいなと思い色々とサイト巡りをしていたらどうにもpandas,numpy,matplotlibというのが必要になるみたいで(※他にもまだまだたくさん必要なことはありますがその中から抜粋してますのでご了承ください笑)勉強&自分用がてらまとめられたらなと。
勉強したてほやほやなので間違いがあったりしたらご指摘いただけますと幸いです。
#pandasについて
pandasの読み方は(パンダス)と読みます。
pandasはpythonのライブラリで主に担当することはcsvの読み書き、編集、消去や1次元、2次元のデータを扱ってくれるやつです。
##pandasの使い方
百聞は一見に如かずなので早速動かしてみましょう。
pip install pandas
これでインストールはok
import pandas as pd
s1 = pd.Series([1,2,3,5])
print(s1)
出力結果
0 1
1 2
2 3
3 5
p2 = pd.DataFrame({
'名前' :['高橋', '田中', '佐藤'],
'身長' : ['178', '171', '168'],
'体重' : [67, 60, 59]
})
print(p2)
出力結果
名前 身長 体重
0 高橋 178 67
1 田中 171 60
2 佐藤 168 59
ざっくり説明しますと
まずinport pandas as pdは毎回毎回pandasって書くの大変だからpdにしよーぜみたいな感じ。
そして記述ですがまずp1の方のSerie(シリーズ)は
1次元のデータを扱うときに使う記述です。
そして
DataFrame(データフレーム)は
2次元のデータということです。
#numpyについて
numpyの読み方は(ナンパイ)もしくは(ナムパイ)です。正直どっちでも大丈夫な気がします笑
numpyもpythonのライブラリで主に配列計算とかを簡単にやってくれます。
##numpyの使い方
さて早速使ってみましょう
pip install numpy
これでインストールはok
import numpy as np
n1 = np.asarray([1,2,3])
n2 = np.asarray([2,3,4])
print(n1 + n2)
出力結果
[3 5 7]
n3 = np.asarray([[1,2,3],[4,5,6]])
print(n3)
出力結果
[[1 2 3]
[4 5 6]]
n4 = np.asarray([[1,2,3],[4,5,6]])
n5 = np.asarray([[7,8,9],[1,4,8]])
print(n4 + n5)
出力結果
[[ 8 10 12]
[ 5 9 14]]
これも先ほどと同じでnumpyをnpにして使います。
そしてご覧の通りに配列同士の計算が簡単に行うことができました。
こりゃおったまげた
#matplotlib
最後はmatplotlibです。読み方は(マットプロットリブ)です。
こいつの主な仕事は簡単にグラフを作ることです。
##matplotlibの使い方
さて早速書いていきましょう。
pip install matplotlib
いつものようにインストールをしてimportしていきます
import matplotlib.pyplot as plt
plt.plot([2,1,3])
plt.show;
出力結果
plt.plot([2,1,3],color="red")
plt.grid(True)
plt.show;
出力結果
ざっくりこんな感じです。
上はただ表示させただけですが、下は線を青くしたのと背景にグリッドを入れました。
グラフになるだけでかなーり見やすくなりますよね。
#最後に
今日紹介したのはかなりざっくりした内容です。なのでpandasやnumpyやmatplotlibを使った楽しい事はまだまだまだあります笑
ってゆーか僕もかなり初心者なのでもっと勉強して記事に出来たらなと思います。