はじめに
RstudioのRと、VscodeのPythonを交互に使っていると、しょっちゅうどっちがどっちだか分からなくなる。groupby()
と書くべきところをgroup_by()
と書いてエラーに怒られて「なんで?」と思ったりする。ということで、自分が混乱しがちなものを整理してみた。
対比表
操作カテゴリ | 操作内容 | VScode/Python/Pandas | Rstudio/R/tidyverse |
---|---|---|---|
ファイル | CSVファイル読込 | pd.read_csv() |
read.csv() |
CSVファイル出力 | df.to_csv() |
write.csv() |
|
ファイル一覧取得 | glob.glob() |
- | |
作業場所 | 現WD取得 | os.getcwd() |
getwd() |
WD設定 | os.chdir() |
setwd() |
|
データ整形 | 並び替え | df.sort_values() |
arrange() |
インデックス設定 | df.set_index() |
- | |
インデックスリセット | df.reset_index() |
- | |
列名変更 | df.rename() |
rename() |
|
列削除 | df.drop() |
select() |
|
列選択 | df.loc[] |
select() |
|
置換 | df.replace() |
- | |
データ型変更 | df.astype() |
- | |
NA削除 | df.dropna() |
drop_na() |
|
重複行削除 | df.drop_duplicates() |
distinct() |
|
データ結合 | 縦結合 | pd.concat() |
rbind() |
横結合 | pd.merge() |
left_join() |
|
集計 | グルーピング | df.groupby() |
group_by() |
集約 | df.sum() |
summarise() |
|
キーボード・ショートカット | 選択行をコメント/非コメント | Ctrl+/ |
Ctrl+Shift+C |
pipe演算子(%>% )を挿入 |
- | Ctrl+Shift+M |
おまけ
getwd()を実行する時、脳内で「♪Get wild and tough ひとりでは~」と歌いがち。