Pandas入門 Chapter0 ~pandasとは~
はじめに
こんばんは。mai-maiです。今日はpandasについてまとめていきたいと思います。その第一回が今回です。不定期ですが何回かに分けてpandasの基本的な部分が理解できるような記事を書いていきたいと思いますのでどうぞよろしくお願いいたします。
対象者:
- pythonの基礎的な部分(if,for,defなど)を理解している
- numpyをある程度扱ったことがある
Pandasとは
pandasとは、表形式のデータを処理することが得意なpythonのライブラリです。最近はやりの機械学習や深層学習といった人工知能が扱うデータはほとんどこのpandasを用いて加工されています。
もしこのあたりの人工知能を扱ってみたいという方は必ずと言っていいほどpandasの習得が必須となります。
もちろん、データ分析をする時もこのpandasが必須となります。excelやcsvファイルを扱い容易に加工することができ、グラフや図の作成も簡単にできるので、pythonでデータ解析を行いたいと思ったら必ずpandasを用いることでしょう。
データフレームについて
データフレームとは次のような形式のデータを言います。
No | Name | Age | Gender |
---|---|---|---|
1 | 田中 | 20 | M |
2 | 山田 | 19 | F |
3 | 鈴木 | 25 | M |
4 | 佐藤 | 30 | F |
2次元の表形式データであり、列の名前のこと(「No」「Name」「Age」「Gender」)をカラムといい、行の名前ことをインデックスといいます。
上記のデータのような、Excelやcsvファイルといったデータを取り込んで扱うことも可能です。むしろこれらのデータを取り込んでpandasで加工することが多いですね。
最後までご覧いただきありがとうございました。