こんにちは,いつもは羊の毛刈りなどをしている者です.
「表の操作はPandasが便利だよ!」 って話を聞いていましたが,
毎回「Pandas 処理」などで検索して全く自分の身についてないので,
Qiitaにまとめてみようとおもい, 今回投稿させていただきます.
(同人界隈でいうと尻たたき的な投稿です, 稚拙なのは了承願います)
動作環境
win10, jupyter notebook上でpython3.7を使用しています.
Pandasってなんだよ
wikipediaによると,
Pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。
という事で, データをいじる人にとって身に付けておくべきものなのかなぁって感じです.
どうやって動かすんだ?
jupyter notebook上なら, pandasをEnvironmentsからインストールして利用が可能です.
インポート
import pandas
毎回pandasって書くのメンドイってひとは
import pandas as pd
ってして, 省略もできる!(こっちが主流)
表の読み込み
今回私は, 10行1列のデータ(CSV)が複数あり, それらを縦方向にまとめたいです.
こんなやつ↓
1.46E+03
1.31E+02
1.43E+02
1.59E+02
2.89E+02
4.40E+02
3.78E+02
1.93E+02
4.08E+02
3.12E+02
今回の場合は, ヘッダー(表のタイトル的なやつ)が何もないので,
data1 = pd.read_csv('hoge/piyo/masked_hue.csv', header=None)
とします.
(ヘッダーなどが付いてるのは他の投稿をご参考下さい)
データの結合
こんな感じで, 簡単にデータを読み込めた.
という事で, データを結合する!
さっきと同様にdata1
とdata2
があるとします.
縦方向に結合する場合は,
data_matome = pd.concat([data1, data2], axis=0)
と書けばOKです!
ここで, axis=0
というものは「軸」という意味で,
axis=0
は「縦軸に」って意味らしい.
つまり, 横軸につなげる時には,
azis=1
とすればOKですね!
データを保存する.
結合したデータを保存したい!
今回はCSV形式での保存がしたいので,
to_csv()
というものを使用します.
今回結合したデータはdata_matome
(汚い変数だな・・・)にしたので,
data_matome.to_csv("matometayo.csv")
という風にすると, matometayo.csv
というCSV形式のファイルが保存されます.
##まとめ
ということで, Pandasの本当に初歩の初歩を触りました.
もっと奥は深いですが, 基礎を知ってる, 知らないは大きいと思うので,
日々精進していこうと思います.
(1/22 17:00 追記)
Pandasのheaderとかindex_colっていうのが凄くクセモノってことが分かった.
とりあえずここも頑張って理解しよう. 理解というか流暢な操作ができるように・・・