##newspicksの記事に触発されてpythonでデータ分析
【プロ直伝】知識ゼロから使える「データサイエンス」14教材
なんかいろいろとトラブルが続いた週を終え、帰りがけのスマホで当記事に気づいた。
早速、土曜の朝から本屋に行って、「戦略的データサイエンス入門」を探したが見つからず、
udemyの、【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門がなんと期間限定で1300円ほどになっていたので、早速実施した。
【ゼロから始めるデータ分析】
いやいや、知らないことだらけで、面白い。
SIGNATE
udemyのレクチャーで上記サイトからデータダウンロードで作業開始なんだけど、
こんなサイトがあることも知らない。
コンテスト? なんじゃ。面白い。
2020年11月:ここで家のパソコンを買い替えたので
再度、初めからやり直すこととした。
なのでこれも書き直そうと思う。
まず、anacondaのインストール。
で、その後は、jupyter notebookで操作する。
おまじないを入れて
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline
データを読み込む
train = pd.read_csv("train.csv")
なるほどなるほど。
データの行数と列数を見る場合は
train.shape
曜日が火となっているデータをyで昇順でみてみる
train[train["week"]=="火"].sort_values(by="y")