データの読み込み
フォーマットの確認
データの表示
欠損値の確認
連結
concatで2つのデータフレームが結合できる。
axis=1で横方向に結合。
keysで名称を指定できる。
データのカウント
qiita.rb
# それぞれのランドマーク数をカウント
landmark_id_count = pd.DataFrame(train.groupby(['landmark_id'])['landmark_id'].count())
print(landmark_id_count)
名前の変更 rename()
landmark_idを各ラウンドマークの総数に変更する
qiita.rb
# Trueだと元のDataFrameが変更される.Flaseだと変更されない
landmark_id_count.rename(columns={'landmark_id': 'Count_Images'}, inplace=True)
print(landmark_id_count)
データのソート
多いランドマーク順にソートする
qiita.rb
landmark_id_count.sort_values(by=['Count_Images'],ascending=False, inplace=True)
print(landmark_id_count)
Indexの付けなおし
多いランドマーク順にソートする
qiita.rb
# indexをつけなおす。drop=Trueにすると元のindexは削除される
landmark_id_count.reset_index(drop=True, inplace=True)
print(landmark_id_count)