イベント内容の備忘録です。
イベント名
[秋葉原] 超初心者向けPython入門会 (プログラミング初心者大歓迎!)
自分の参加目的
- Python入門で必要だろう知識について、先人に教えをこい、理解を深めたい!
→期待値に見合った勉強会だった。何より、先生や他の参加者の方の雰囲気が楽して、あっという間だった!
主催者様側のゴール(私解釈)
- pythonのライブラリ(pandas)でできることを見て、可能性を感じてもらう!
勉強会スタート!
pythonとは
- 汎用プラログラミング言語。組込み系と相性が良い(raspberry pi)。作業の自動化。スクレイピング。Excelに向いていない大量データを扱うのに向いている
- 初心者におすすめ書籍 「退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング」
- 今回はgoogole colab環境でpythonを触るよ!
- google colabはgoogle社が提供しているオンライン環境。1クリックでGPUに切り替え可能なので、大量データの扱いはめっちゃ早いとのこと!
- エディタは、 jupyter notebook もおすすめ。実行結果やグラフが下列にすぐに出力されるのでわかりやすい!
-
print('便利でしょ'+'ね?'*10)
←これ好き^^ - 文字列はシングルクォーテーションまたは、ダブルクォーテーションで囲むこと。IF文、While文、関数は、タブ2回でインデント!
pythonのpandasライブラリとは
- pandasとは、データ解析を支援する便利なライブラリ!
- 雑多なデータをpandas(データフレーム)に入れることにより、解析がしやすくなる。データフレームとは、2次元のデータ構造を指す。縦軸はindex,横軸はcolumns。
jupyter notebook とgoogle colab のデータセットの読み込みの違い
- 2つのエディタ(環境)共に、pythonを使える環境が提供されている
- google colabはファイル読み込むときは、google driveに格納されているファイルを読み込む
from google.colab import files
uploaded = files.upload()
- jupyter notebook はローカルフォルダのファイルを読み込む
データセットに使える政府機関のサイト(ただし手加工必要)
- e-Stat
- 日本政府が運営する統計サイト。
- ただ、こちらの統計データは、Excel上で扱うことをイメージして作られているので、直でpandasで読み込むのはNG。
- Excelの縦・横軸で不要な行を削除してから、pandasにInportするのが良い。
- 言いたいことは、「pandasはなんでもやってくれる銀の弾丸ではない! e-Statは凄くいいデータを持っているので、使ってみるのが良いよ!」
感想
- jupyterもgoogle colabも他の勉強サイトを通して触ったことがあったが、実際に使っている人から対面で聞くのは、自分の道具の使い方のブラッシュアップになっていい(こうやって使うといいよ〜)。
- 先生も参加者の方も、いろんな職業・職種が混ざっていて、かつ和気藹々な空気感だったので、凄く楽しかったです。
参加者Slackチームで共有されたサイト(面白い!)
- アヤメデータを使った機械学習の流れを簡単にまとめてみた ←勉強会で扱ったデータ