Pandasについての記事をシリーズで書いています。
今回の記事は第9回目になります。
今回はPandasのメソッドの中でも、データの計算をするのに便利なメソッドを集めてみました。
計算をするメソッドは他にもたくさんありますが、ベーシックなものだけを集めてみました。
ただ『ベーシック』と言っても、
あなたがカスタマイズした計算をさせるにはどのようなメソッドを使えば良いのか?
というところまで踏み込んで書いていますので、是非最後まで読んでみてくださいね。
ではさっそく始めていきます!
data.worldさんのサイトで見つけたFacebookの株価のデータを使っていきます
※2012年から2021年までの株価の変遷のデータです。
という人は上記の項目がそれぞれリンクになっていますので、クリックしてアクセスしてみてください。
Series の中で有効な数字が書かれたアイテム数を返す。
今回使ったデータは値が欠損している部分がないので、row の数と.count()ではじき出した値は一緒です。
※pythonのlen()との違いは、len() は値が抜けて『nan』などなっていても、それも含めて数えられますが、.count()は有効な物だけを数えて値を返します。
sum()は簡単ですね。
全ての項目を足したものです。
mean()は平均値のことです。
(全ての項目を足したもの) / (項目数) になります
#median()
中央値になります。
中央値とは、
アイテムを小さい物から順に、もしくは大きい物から順番に並べた時に両端から等しい距離にある点の値のことを言います。
min()はデータの中の最小値を、max()はデータの中の最大値を返してくれます
Facebookの株価は約17倍になっているんですね。。。(溜息。。。)
describe()は今まで一つづつ説明してきたメソッドの役割を全部一気にやってくれるような便利なメソッドです。
value_counts() はデータの中でそれぞれのvalue がいくつ含まれているかの値を返してくれます
株価のデータでは株価は毎日違っているので、このメソッドを使うことはないでしょうが。。。
例えば、以前にこちらの記事で
タイタニック号事件で亡くなった人と生存者の数
を数えてみました。(0が亡くなった、1が生存しているで表されている)
このような場合に
value_counts()
は便利だと思います
#apply()
ではFacebook の株価のデータに戻って話を進めていきますね。
Facebookの株価の歴史を見てFacebook の株価が
100ドル以下なら『買え!』
100ドルから250ドルなら『待て』
250ドル以上なら『売れ!』
と表示したいとなったらどうしたら良いでしょうか?
そんな機能のあるPandas のメソッドはないので、あなたがカスタマイズします。
引用元:Pandasドキュメント
apply() メソッドのパラメーターfunc はあなたの作った関数を引数に取ることができます。
python の関数を作り、その関数をFacebookの株価の値で呼び出してみました。
ちなみに私は投資家でもなんでもないので、250ドル以上になれば『売れ!』とかは適当に決めた基準なので、そこはご理解くださいませ。<(_ _)>
#まとめ
今回の記事はこれくらいで終わりにします。
今回の記事では、データの計算に使えそうなメソッドを集めてみました。
お役に立てれば幸いです。