そういえば変数名や列名に日本語使えるよ、というだけの記事です。
僕は人間向けに作られた列名が日本語の Excel ファイルを R で読み込んでそのまま強行突破するので、自然とコードが日本語だらけになります。そういうコードを書くと引き継ぎのときプロジェクトメンバに嫌われます。
わざわざ日本語で書いた例
library(tidyverse)
data(iris)
アヤメ <- iris
列名を変える <- rename
グループ化する <- group_by
集計する <- summarise
最小値を求める <- min
中央値を求める <- median
最大値を求める <- max
アヤメ %>%
列名を変える(
がく片の長さ = Sepal.Length,
がく片の幅 = Sepal.Width,
花びらの長さ = Petal.Length,
花びらの幅 = Petal.Width,
種類 = Species
) %>%
グループ化する(種類) %>%
集計する(
がく片の長さの最小値 = 最小値を求める(がく片の長さ),
がく片の長さの中央値 = 中央値を求める(がく片の長さ),
がく片の長さの最大値 = 最大値を求める(がく片の長さ)
)
実行結果
# A tibble: 3 x 4
種類 がく片の長さの最小値 がく片の長さの中央値 がく片の長さの最大値
<fct> <dbl> <dbl> <dbl>
1 setosa 4.3 5 5.8
2 versicolor 4.9 5.9 7
3 virginica 4.9 6.5 7.9
使えない文字もありますが、そういうときはバッククォート `
でくくれば動きます。これでデータフレームのヘッダが 種類 ※目的変数
のような人にやさしい値になっていても大丈夫です。
> ★ <- 1
Error: unexpected input in "・
> `★` <- 1
> ★
Error: unexpected input in "・
> `★`
[1] 1